Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/GuocaiL/nlp_corpus
本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。
https://github.com/GuocaiL/nlp_corpus
Last synced: 2 days ago
JSON representation
本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。
- Host: GitHub
- URL: https://github.com/GuocaiL/nlp_corpus
- Owner: GuocaiL
- Created: 2020-10-20T16:13:06.000Z (about 4 years ago)
- Default Branch: main
- Last Pushed: 2020-11-17T11:45:58.000Z (almost 4 years ago)
- Last Synced: 2024-07-10T21:25:22.503Z (4 months ago)
- Language: Python
- Size: 16.6 MB
- Stars: 103
- Watchers: 4
- Forks: 55
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- StarryDivineSky - GuocaiL/nlp_corpus
README
# nlp_corpus
## 1 中文实体识别
- open_ner_data为网上开放的ner数据集,已将不同的数据格式转化为统一的数据格式,格式转换脚本为data_transfer.py
### 1.1 boson数据集
### 1.2 clue细粒度实体识别数据集
### 1.3 微软实体识别数据集
### 1.4 人民网实体识别数据集(98年)
### 1.5 中药说明书实体识别数据集(“万创杯”中医药天池大数据竞赛)
### 1.6 视频_音乐_图书数据集
### 1.7 微博数据集