https://github.com/HanXinzi-AI/awesome-NLP-resources
a collection of NLP projects&tools. 自然语言处理方向项目和工具集合。
https://github.com/HanXinzi-AI/awesome-NLP-resources
List: awesome-NLP-resources
audio-processing chatbot knowledge-graph language-understanding machine-translation natural-language-processing nlp question-answering senmantic-matching sentiment-analysis sequence-labeling text text-classification text-generation text-matching text-retrieval text-summarization time-series-analysis time-series-forecasting
Last synced: 7 months ago
JSON representation
a collection of NLP projects&tools. 自然语言处理方向项目和工具集合。
- Host: GitHub
- URL: https://github.com/HanXinzi-AI/awesome-NLP-resources
- Owner: HanXinzi-AI
- Created: 2021-04-27T09:10:26.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2024-06-03T12:39:04.000Z (over 1 year ago)
- Last Synced: 2025-04-10T05:05:08.861Z (7 months ago)
- Topics: audio-processing, chatbot, knowledge-graph, language-understanding, machine-translation, natural-language-processing, nlp, question-answering, senmantic-matching, sentiment-analysis, sequence-labeling, text, text-classification, text-generation, text-matching, text-retrieval, text-summarization, time-series-analysis, time-series-forecasting
- Homepage:
- Size: 17.2 MB
- Stars: 194
- Watchers: 2
- Forks: 31
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- Changelog: history/2021-04-28_changes.md
Awesome Lists containing this project
- awesome-python-machine-learning-resources - **NLP项目和资源大全**
- awesome-jupyter-resources - **NLP项目和资源大全**
README
自然语言处理项目&工具库&资源大全
自然语言处理项目&工具库&资源大全,划分子领域版块汇集梳理,每周自动更新
本资源清单包含100个python自然语言处理相关的项目&工具库&资源,这些资源总共分成11个不同的子板块,这些项目目前在github上已经收到180K个点赞。所有的工具资源每周会自动从GitHub和工具维护平台采集信息,并更新梳理展示。本清单参考[best-of模板](https://github.com/best-of-lists/best-of)完成,欢迎大家提PR丰富本清单。
---
## 目录
- [文本分类](#文本分类) _9 个项目案例_
- [情感分析](#情感分析) _6 个项目案例_
- [序列标注](#序列标注) _5 个项目案例_
- [问答系统与聊天机器人](#问答系统与聊天机器人) _8 个项目案例_
- [语音应用](#语音应用) _11 个项目案例_
- [知识图谱](#知识图谱) _10 个项目案例_
- [文本生成](#文本生成) _11 个项目案例_
- [文本摘要生成](#文本摘要生成) _10 个项目案例_
- [阅读理解](#阅读理解) _4 个项目案例_
- [时间序列](#时间序列) _10 个项目案例_
- [机器翻译](#机器翻译) _8 个项目案例_
- [文本检索与语义匹配](#文本检索与语义匹配) _9 个项目案例_
## 文本分类
facebookresearch-fastText
⭐ 24K · :octocat: Code
facebookresearch的fastText工具库
.jpg)
text_classification(brightmart)
⭐ 7.4K · :octocat: Code
brightmart实现的多种中文文本分类模型
by @brightmart

facebookresearch-pytext
⭐ 6.3K · :octocat: Code
facebookresearch的pytext工具库

PaddleNLP
⭐ 5.2K · :octocat: Code
PaddlePaddle NLP工具库

Paddle-ERNIE
⭐ 5.1K · :octocat: Code
PaddlePaddle实现的ERNIE

Chinese-Text-Classification-Pytorch
⭐ 3.8K · :octocat: Code
Pytorch实现的多种中文文本分类模型
by @649453932

Bert-Chinese-Text-Classification-Pytorch
⭐ 2.5K · :octocat: Code
Pytorch实现的基于transformer/BERT的中文文本分类模型
by @649453932

Text_Classification
⭐ 1.6K · :octocat: Code
kk7nc Text_Classification
by @kk7nc
.jpg)
NeuralNLP-NeuralClassifier(Tencent)
⭐ 1.4K · :octocat: Code
腾讯文本分类开源项目,包含多种模型实现和完整模型构建流程
by @Tencent
## 情感分析
pytorch-sentiment-analysis
⭐ 3.6K · :octocat: Code
pytorch实现的情感分析建模
by @bentrevett

Aspect-Based-Sentiment-Analysis
⭐ 1.6K · :octocat: Code
基于不同粒度的图卷积网络情感分析实现。
by @songyouwei

baidu-Senta
⭐ 1.6K · :octocat: Code
百度的Senta情感分析项目
by @baidu

BDCI2019-Sentiment-classification
⭐ 440 · :octocat: Code
BDCI2019情感分析比赛第1名方案
by @cxy229

Customer_Satisfaction_Analysis
⭐ 330 · :octocat: Code
消费者满意度分析建模
by @CarryChang

chinese-customer-review
⭐ 34 · :octocat: Code
中文点评网站评论数据
by @lsvih
## 序列标注
Chinese-DeepNER
⭐ 700 · :octocat: Code
深度学习命名实体识别项目
by @z814081807

BERT-for-Sequence-Labeling-and-Text-Classification
⭐ 410 · :octocat: Code
基于bert的序列标注与文本分类
by @yuanxiaosc

sequence_tagging
⭐ 390 · :octocat: Code
序列标注实现
by @qiufengyuyi

Macadam
⭐ 300 · :octocat: Code
Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。
by @yongzhuo

seq2annotation
⭐ 80 · :octocat: Code
序列标注的实现方案
## 问答系统与聊天机器人
DeepPavlov
⭐ 5.8K · :octocat: Code
深度学习端到端的对话系统
by @deepmipt

haystack
⭐ 5.2K · :octocat: Code
端到端的深度学习问答检索系统
by @deepset-ai

baidu-AnyQ
⭐ 2.4K · :octocat: Code
百度的AnyQ高频问题检索式问答系统
by @baidu

Chatbot_CN
⭐ 1.1K · :octocat: Code
基于金融-司法领域(兼有闲聊性质)的聊天机器人
by @charlesXu86

Chinese-Chatbot-PyTorch
⭐ 670 · :octocat: Code
基于pytorch实现的对话机器人
by @Doragd

58-qa_match
⭐ 310 · :octocat: Code
58的匹配型问答系统实现
by @wuba

pytorch-question-answering
⭐ 240 · :octocat: Code
pytorch问答系统实现
by @kushalj001

gpt2-bert-reddit-bot
⭐ 180 · :octocat: Code
基于gpt2和bert的reddit问答机器人实现
## 语音应用
ASRT_SpeechRecognition
⭐ 5.7K · :octocat: Code
基于深度学习的中文语音识别系统
by @nl8590687

TensorFlowTTS
⭐ 2.8K · :octocat: Code
tensorflow实现的文本转语音项目

NVIDIA-waveglow
⭐ 2K · :octocat: Code
NVIDIA的waveglow语音合成项目
by @NVIDIA

TransformerTTS
⭐ 920 · :octocat: Code
基于transformer的tts文本转语音实现
by @as-ideas

noisereduce
⭐ 720 · :octocat: Code
智能降噪项目
by @timsainb

Speech-Transformer
⭐ 690 · :octocat: Code
Speech-Transformer语音识别项目
by @kaituoxu

Multilingual_Text_to_Speech
⭐ 580 · :octocat: Code
多语言文本转语音实现
by @Tomiinek

inaSpeechSegmenter
⭐ 520 · :octocat: Code
语音智能分割项目
by @ina-foss

Speech-enhancement
⭐ 390 · :octocat: Code
语音增强项目
by @vbelz

OpenTransformer
⭐ 310 · :octocat: Code
基于transformer的语音识别

tacotron2
⭐ 100 · :octocat: Code
tacotron2语音合成项目
by @ide8
## 知识图谱
QASystemOnMedicalKG
⭐ 4.2K · :octocat: Code
医疗知识图谱构建与问答推理
by @liuhuanyong

KnowledgeGraphData
⭐ 4.1K · :octocat: Code
知识图谱数据集合
by @ownthink

awesome-knowledge-graph
⭐ 3.4K · :octocat: Code
awesome知识图谱资料
by @husthuke

Agriculture_KnowledgeGraph
⭐ 3.2K · :octocat: Code
农业知识图谱项目
by @qq547276542

KnowledgeGraphCourse
⭐ 3K · :octocat: Code
东南大学知识图谱课程
by @npubird

Financial-Knowledge-Graphs
⭐ 1.9K · :octocat: Code
金融知识图谱项目
by @jm199504

stock-knowledge-graph
⭐ 1.6K · :octocat: Code
股票金融知识图谱项目
by @lemonhu

knowledge-graphs
⭐ 1.3K · :octocat: Code
知识图谱
by @shaoxiongji

NLP-Knowledge-Graph
⭐ 1.2K · :octocat: Code
NLP知识图谱资料
by @lihanghang

QASystemOnMedicalGraph
⭐ 860 · :octocat: Code
基于医疗知识图谱的问答系统
by @zhihao-chen
## 文本生成
GPT2-Chinese
⭐ 5.2K · :octocat: Code
GPT2中文生成
by @Morizeyao

texar
⭐ 2.3K · :octocat: Code
texar NLP工具库,可用于文本生成
by @asyml

gpt2-ml
⭐ 1.4K · :octocat: Code
gpt2中文文本生成
by @imcaspar

Texygen
⭐ 840 · :octocat: Code
文本生成
by @geek-ai

texar-pytorch
⭐ 720 · :octocat: Code
texar的pytorch实现
by @asyml

transformer-xl-chinese
⭐ 610 · :octocat: Code
transformer-xl中文文本生成
by @GaoPeng97

awesome-text-generation
⭐ 460 · :octocat: Code
awesome文本生成资料

aichpoem
⭐ 160 · :octocat: Code
诗歌生成

CoupletAI
⭐ 140 · :octocat: Code
AI对联生成
by @WiseDoge

gpt-2-poetry
⭐ 84 · :octocat: Code
gpt2诗歌生成

QueryGeneration
⭐ 83 · :octocat: Code
基于深度学习的相似问题生成
## 文本摘要生成
awesome-text-summarization
⭐ 1.2K · :octocat: Code
awesome文本摘要生成资料
by @icoxfog417

bert-extractive-summarizer
⭐ 1K · :octocat: Code
基于bert的抽取式文本摘要生成
by @dmmiller612

GPT2-NewsTitle
⭐ 690 · :octocat: Code
GPT2新闻标题自动生成
by @liucongg

Text-Summarization-Papers
⭐ 460 · :octocat: Code
文本总结与摘要生成相关论文
by @neulab

seq2seq-summarizer
⭐ 350 · :octocat: Code
seq2seq文本摘要生成
by @ymfa

GPT2-Summary
⭐ 290 · :octocat: Code
GPT2文本摘要生成

Bart_T5-summarization
⭐ 150 · :octocat: Code
基于Bart-T5的文本摘要生成

TranSummar
⭐ 130 · :octocat: Code
基于transformer的抽取式文本摘要生成
by @lipiji

nnsum
⭐ 100 · :octocat: Code
基于深度学习的文本总结
by @kedz

Neural-Abstractive-Text-Summarization
⭐ 100 · :octocat: Code
LeafNATS文本摘要生成框架
by @tshi04
## 阅读理解
mt-dnn
⭐ 2K · :octocat: Code
基于多任务深度学习网络的文本理解
by @namisan

Adversarial-Training-for-Natural-Language-Understanding
⭐ 230 · :octocat: Code
基于对抗训练(Adversarial Training)的文本理解实现
by @zhuchen03

microsoft-Natural-Language-Understanding
⭐ 120 · :octocat: Code
基于多任务深度学习网络的文本理解(微软)
by @microsoft

capsule-mrc
⭐ 88 · :octocat: Code
基于capsule的观点型阅读理解模型
## 时间序列
sktime
⭐ 5.6K · :octocat: Code
scikit机器学习时间序列预估

neural_prophet
⭐ 2.5K · :octocat: Code
基于神经网络的prophet时间序列预估
by @ourownstory

pytorch-forecasting
⭐ 2.2K · :octocat: Code
pytorch时序预估
by @jdb78

pytorch-ts
⭐ 740 · :octocat: Code
基于pytorch的时间序列预估

transformer-time-series-prediction
⭐ 610 · :octocat: Code
基于transformer的时间序列预估
by @oliverguhr

DeepLearning-For-Time-Series-Forecasting
⭐ 560 · :octocat: Code
微软深度学习时间序列预估实现
by @Azure

sktime-dl
⭐ 560 · :octocat: Code
scikit深度学习时间序列分类与回归
by @sktime

awesome-time-series
⭐ 510 · :octocat: Code
awesome时间序列预估资料
by @cuge1995

Deep-Time-Series-Prediction
⭐ 380 · :octocat: Code
深度学习时间序列预估
by @EvilPsyCHo

scikit-hts
⭐ 200 · :octocat: Code
scikit层次化时间序列预估库
## 机器翻译
tensorflow-nmt
⭐ 6.1K · :octocat: Code
tensorflow神经网络机器翻译库
by @tensorflow

OpenNMT-py
⭐ 5.7K · :octocat: Code
OpenNMT神经网络机器翻译库
by @OpenNMT

facebookresearch-UnsupervisedMT
⭐ 1.5K · :octocat: Code
FacebookResearch的无监督机器翻译库

OpenNMT-tf
⭐ 1.3K · :octocat: Code
OpenNMT神经网络机器翻译库(tensorflow版本)
by @OpenNMT

nematus
⭐ 780 · :octocat: Code
nematus神经网络机器翻译库

translators
⭐ 760 · :octocat: Code
机器翻译库
by @UlionTse

EasyNMT
⭐ 610 · :octocat: Code
EasyNMT神经网络机器翻译库
by @UKPLab

joeynmt
⭐ 560 · :octocat: Code
神经网络机器翻译
by @joeynmt
## 文本检索与语义匹配
MatchZoo
⭐ 3.7K · :octocat: Code
包含多种文本匹配模型的MatchZoo库

awesome-neural-models-for-semantic-match
⭐ 750 · :octocat: Code
awesome神经网络语义匹配资料

text_matching
⭐ 620 · :octocat: Code
文本匹配模型实现
by @terrifyzhao

TextMatch
⭐ 580 · :octocat: Code
TextMatch文本匹配实现

eBay-Sequence-Semantic-Embedding
⭐ 450 · :octocat: Code
eBay的序列语义embedding工具库
by @eBay

deepmatcher
⭐ 440 · :octocat: Code
深度学习文本匹配库
by @anhaidgroup

alibaba-simple-effective-text-matching
⭐ 330 · :octocat: Code
ACL2019论文“简单高效文本匹配”实现
by @alibaba-edu

alibaba-simple-effective-text-matching-pytorch
⭐ 270 · :octocat: Code
ACL2019论文“简单高效文本匹配”实现(pytorch版本)
by @alibaba-edu

Semantic-Search
⭐ 100 · :octocat: Code
语义检索系统
---
## 相关资源
- [**Python资源汇集列表**](https://github.com/HanXinzi-AI/awesome-python-resources): 周更新的各种应用方向与主题的资源汇集列表
- [**python机器学习资源大全**](https://github.com/HanXinzi-AI/awesome-python-machine-learning-resources): 周更新的各种python机器学习资源汇集列表
- [**Jupyter及相关工具资源大全**](https://github.com/HanXinzi-AI/awesome-jupyter-resources): 周更新的各种Jupyter及相关工具资源汇集列表
- [**NLP项目和资源大全**](https://github.com/HanXinzi-AI/awesome-NLP-resources): 周更新的各种NLP板块涉及的项目和工具资源汇集列表
- [**CV项目和资源大全**](https://github.com/HanXinzi-AI/awesome-computer-vision-resources): 周更新的各种CV板块涉及的项目和工具资源汇集列表











