awesome-chinese-nlp
A curated list of resources for Chinese NLP 中文自然语言处理相关资料
https://github.com/crownpku/awesome-chinese-nlp
Last synced: 1 day ago
JSON representation
-
Chinese NLP Toolkits 中文NLP工具
-
Popular NLP Toolkits for English/Multi-Language 常用的英文或支持多语言的NLP工具包
- spaCy - Strength Natural Language Processing with a [online course](https://course.spacy.io/)
- OpenNLP
- Stanza
- CoreNLP
- textacy
- Kashgari - Simple and powerful NLP framework, build your state-of-art model in 5 minutes for named entity recognition (NER), part-of-speech tagging (PoS) and text classification tasks. Includes BERT and word2vec embedding.
- gensim
- NLTK
-
Toolkits 综合NLP工具包
- THULAC 中文词法分析工具包
- BaiduLac - source lexical analysis tool for Chinese, including word segmentation, part-of-speech tagging & named entity recognition.
- LTP 语言技术平台 - SCIR/pyltp) LTP的python封装
- HanLP
- FoolNLTK
- FudanNLP
- NLPIR
- Poplar - based annotation tool for natural language processing (NLP)
- SnowNLP
- 小明NLP
- FastNLP
- Jiagu
- YaYaNLP
- DeepNLP
- chinese_nlp
- lightNLP
- SmoothNLP
- Chinese-Annotator
-
Chinese Word Segment 中文分词
- loso 中文分词
- Jieba 结巴中文分词
- Go语言高性能分词
- Ansj中文分词 - Gram+CRF+HMM的中文分词的java实现
- kcws 深度学习中文分词
- 北大中文分词工具
- Genius 中文分词
- ID-CNN-CWS
- yaha "哑哈"中文分词
- ChineseWordSegmentation
-
QA & Chatbot 问答和聊天机器人
- ChatScript - based chatbot engine.
- 基于SmartQQ的自动机器人框架
- AnyQ by Baidu
- Tipask
- Chatterbot
- Snips NLU
- QuestionAnsweringSystem
- QASystemOnMedicalKG
- 使用TensorFlow实现的Sequence to Sequence的聊天机器人模型
- Rasa Core
- DuReader中文阅读理解Baseline代码
- GPT2-chitchat
- CDial-GPT
- DeepPavlov - to-end dialog systems and training chatbots.
- Rasa NLU
- 使用深度学习算法实现的中文阅读理解问答系统
- Chatstack
- Chatbot
- QA-Snake
- Chatstack
-
Information Extraction 信息提取
-
Multi-Modal Representation & Retrieval 多模态表征与检索
- Chinese-CLIP - CLIP是中文多模态图文表征预训练模型。其基于OpenAI的CLIP模型结构,利用大规模中文原生图文语料完成预训练,目前开源了多个模型规模,同时公开了技术报告论文及检索demo
-
-
Corpus 中文语料
-
Multi-Modal Representation & Retrieval 多模态表征与检索
- Tencent AI Lab Embedding Corpus for Chinese Words and Phrases
- 大规模中文概念图谱CN-Probase
- CLDC中文语言资源联盟
- 中文 Wikipedia Dump
- 98年人民日报词性标注库@百度盘
- 搜狗20061127新闻语料(包含分类)@百度盘
- tushare财经数据接口
- DuReader中文阅读理解数据
- 中文数据预处理材料
- OpenCorpus
- 中文维基23万高质量词条-更新至23年7月-已过滤敏感或争议性信息
- 大规模中文自然语言处理语料
- 最全中华古诗词数据库
- 中文GPT2训练代码
- 大规模1.4亿中文知识图谱开源下载
- 中华新华字典数据库
- 开放中文知识图谱的schema
- 中文人名语料库
- 上百种预训练中文词向量
- 中文预训练BERT with Whole Word Masking
- 农业知识图谱
- ChineseNlpCorpus
- OpenCLaP
- 公司名、机构名语料库
- 基于不同语料、不同模型(比如BERT、GPT)的中文预训练模型
- 中文敏感词词库
- 漢語拆字字典
- Chinese-Literature-NER-RE-Dataset - Level Named Entity Recognition and Relation Extraction Dataset for Chinese Literature Text
- tushare财经数据接口
- 中文语料小数据
- People's Daily & Children's Fairy Tale
- 用于训练中英文对话系统的语料库
- 八卦版問答中文語料
- 开放知识图谱OpenKG.cn
- 大规模中文概念图谱CN-Probase
- CLDC中文语言资源联盟
- 中文word2vec模型
- 中文语言理解测评基准ChineseGLUE
- Chinese_conversation_sentiment
- 中文突发事件语料库
- 中国股市公告信息爬取
- 金融文本数据集
- ChineseTextualInference
- 中文简称词库
- SentiBridge: 中文实体情感知识库
- Synonyms:中文近义词工具包
- 中文公开聊天语料库
- dgk_lost_conv 中文对白语料
- 保险行业语料库
-
-
Learning Materials 学习资料
-
Multi-Modal Representation & Retrieval 多模态表征与检索
- Speech and Language Processing
- Stanford CS224n Natural Language Processing with Deep Learning 2017
- Oxford CS DeepNLP 2017
- 52nlp 我爱自然语言处理
- hankcs 码农场
- Chinese NLP - of-the-art results for Chinese Natural Language Processing
- 中文Deep Learning Book
- 文本处理实践课资料 - IDF),文本分类,文本聚类,word2vec训练词向量及同义词词林中文词语相似度计算、文档自动摘要,信息抽取,情感分析与观点挖掘等实验。
- nlp_tasks
- NLP研究入门之道
- hankcs 码农场
- 52nlp 我爱自然语言处理
-
-
Organizations 中文NLP学术组织及竞赛
-
Multi-Modal Representation & Retrieval 多模态表征与检索
- 清华大学自然语言处理与人文计算实验室
- 北京大学计算语言学教育部重点实验室
- 中科院计算所自然语言处理研究组
- 哈工大智能技术与自然语言处理实验室
- 哈工大社会计算与信息检索研究中心
- 复旦大学自然语言处理组
- 苏州大学自然语言处理组
- 南京大学自然语言处理研究组
- 东北大学自然语言处理实验室
- 厦门大学智能科学与技术系自然语言处理实验室
- 郑州大学自然语言处理实验室
- 华为诺亚方舟实验室
- CUHK Text Mining Group
- PolyU Social Media Mining Group
- National Taiwan University NLP Lab
- 中国中文信息学会
- NLP Conference Calender
- 2017 第一届“讯飞杯”中文机器阅读理解评测
- 2017 AI-Challenger 图像中文描述
- 2017 AI-Challenger 英中机器文本翻译
- 2017 知乎看山杯机器学习挑战赛
- 2018 开放领域的中文问答任务
- 2018 微众银行智能客服问句匹配大赛
- HKUST Human Language Technology Center
- NLP Conference Calender
- HKUST Human Language Technology Center
- 北京大学计算语言学教育部重点实验室
- 中科院计算所自然语言处理研究组
- 哈工大智能技术与自然语言处理实验室
- 哈工大社会计算与信息检索研究中心
- 南京大学自然语言处理研究组
- 东北大学自然语言处理实验室
- 厦门大学智能科学与技术系自然语言处理实验室
- PolyU Social Media Mining Group
- 中国中文信息学会
- 2017 第一届“讯飞杯”中文机器阅读理解评测
-
-
Industry 中文NLP商业服务
Programming Languages
Categories
Sub Categories
Keywords
nlp
27
chinese
12
python
11
named-entity-recognition
9
natural-language-processing
9
ner
8
machine-learning
8
text-classification
7
chinese-nlp
7
deep-learning
6
pytorch
6
tensorflow
5
bert
5
gpt-2
5
chinese-word-segmentation
4
question-answering
4
chatbot
4
bot
4
corpus
4
java
4
dataset
3
text-generation
3
relation-extraction
3
information-extraction
3
cws
2
artificial-intelligence
2
chinese-characters
2
transformer
2
lexical-analysis
2
gpt
2
dict
2
nlp-library
2
nlp-parsing
2
classification
2
dialogue-systems
2
dialogue
2
slot-filling
2
postagging
2
machine-learning-library
2
sentence-similarity
2
language-model
2
intent-classification
2
word2vec
2
pos
2
json
2
language
2
roberta
2
tipask
1
php
1
laravel
1