Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
awesome-nlp-chinese-corpus
A curated list of resources of chinese corpora for NLP(Natural Language Processing)
https://github.com/wangmuy/awesome-nlp-chinese-corpus
Last synced: 4 days ago
JSON representation
-
Contents 列表
-
综合内容
- ldc.upenn.edu
- CoNLL
- 维基百科中文
- microblogPCU
- 北京大学开放研究数据平台
- Multilingual ATIS
- 中文文本分类数据集 THUCNews
- NLPCC 2017 国际自然语言处理及中文计算会议
- 新闻头条摘要
- NLPCC 2018
- CCKS 2019 全国知识图谱与语义计算大会
- 任务2: 面向中文短文本的实体链指任务
- 任务3: 人物关系抽取
- 任务4: 面向金融领域的事件主体抽取
- CCKS 2018 全国知识图谱与语义计算大会
- CCKS 2017 全国知识图谱与语义计算大会
- 问题命名实体识别和链接
- SMP 2018 第七届全国社会媒体处理大会
- 用户画像技术评测
- 中文人机对话技术评测 用户意图领域分类
- 文本溯源技术评测
- SMP 2017 第六届全国社会媒体处理大会
- CSDN用户画像技术评测
- SMP 2016 第五届全国社会媒体处理大会
- 微博用户画像
- WSDM杯 2019 假新闻分类
- 京东商品 评论
- 大众点评 评论
- 英中翻译数据集2018
- 细粒度用户评论情感分析数据集2018
- 观点型问题阅读理解数据集2018
- 玻森中文语义开放平台
- 中文开放知识图谱
- biendata.com 数据竞赛
- 2018搜狐内容识别算法大赛 新闻和新闻配图
- 成语阅读理解大赛
- 文本分类语料库(复旦)测试语料
- DuReader Dataset
- 我爱自然语言处理-新闻语料库
- blog.just4fun.site
- Erheng Zhong 豆瓣电影
- 人民日报 NER
- 豆瓣短影评
- 小说: 斗破苍穹
- 知乎热榜Top50
- 豆瓣长安十二时辰500条评论
- 豆瓣读书数据集
- 去哪儿网—数据清洗
- 豆瓣电影数据集
- bilibili流行动漫影评数据
- 《中餐厅3》19W弹幕数据
- 中文新闻数据集
- 豆瓣《哪吒之魔童降世》影评
- OpenSubtitles
-
Embedding 词嵌入
-
Categories
Sub Categories