https://github.com/renfei/dict
中文词库/词典,可用于NLP项目、分词等场景
https://github.com/renfei/dict
chinese dict dictionary nlp
Last synced: about 2 months ago
JSON representation
中文词库/词典,可用于NLP项目、分词等场景
- Host: GitHub
- URL: https://github.com/renfei/dict
- Owner: renfei
- License: mit
- Created: 2022-05-07T01:25:48.000Z (over 3 years ago)
- Default Branch: master
- Last Pushed: 2022-06-15T00:45:48.000Z (over 3 years ago)
- Last Synced: 2025-08-15T22:26:26.058Z (about 2 months ago)
- Topics: chinese, dict, dictionary, nlp
- Homepage:
- Size: 78 MB
- Stars: 57
- Watchers: 1
- Forks: 18
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- Contributing: CONTRIBUTING.md
- License: LICENSE
Awesome Lists containing this project
README
# 中文词库/词典
最近更新日期:2022-05-07
本仓库用于收录中文词库/词典,可用于NLP项目、分词等场景。
有强大的词库/词典支持,相信你的项目会更加智能和高效!
## 搜狗输入法词库
本仓库[sogou](sogou)目录中的数据来自搜狗输入法词库,分类如下:
* [城市信息](sogou/城市信息)
* [自然科学](sogou/自然科学)
* [社会科学](sogou/社会科学)
* [工程应用](sogou/工程应用)
* [农林渔畜](sogou/农林渔畜)
* [医学医药](sogou/医学医药)
* [电子游戏](sogou/电子游戏)
* [艺术设计](sogou/艺术设计)
* [生活百科](sogou/生活百科)
* [运动休闲](sogou/运动休闲)
* [人文科学](sogou/人文科学)
* [娱乐休闲](sogou/娱乐休闲)全部分类的聚合文件请到发布页面[https://github.com/renfei/dict/releases](https://github.com/renfei/dict/releases)下载
## 开源共建
如果你有好的词库/词典欢迎向仓库提交。
### 仓库配额限制
由于 Github 对仓库配额有限制,需要您注意以下内容:
* 单个文件不能超过 100MB 的大小,Github 会拒绝 Push。
* 总仓库大小不能超过 5GB。如果您的文件超过 100MB,请联系[i@renfei.net](mailto:i@renfei.net)通过网盘的方式发送给我,大文件将在发布页面进行发布[https://github.com/renfei/dict/releases](https://github.com/renfei/dict/releases)
#### Gitee 码云的仓库配额限制
由于 Gitee 对仓库配额有限制,当达到以下条件时,将停止在 Gitee 上的更新:
* 单个文件不能超过 50MB 的大小,Gitee 会拒绝 Push。
* 总仓库大学不能超过 500MB。## 其他
如果你需要分词工具可参考 IK Analyzer:[https://github.com/renfei/ik-analyzer](https://github.com/renfei/ik-analyzer)
如果你需要搜狗词库 Scel 文件转换可参考:[https://github.com/renfei/SogouScelFileProcessing](https://github.com/renfei/SogouScelFileProcessing)