An open API service indexing awesome lists of open source software.

https://github.com/zispace/hanzi-words

汉语常用词表
https://github.com/zispace/hanzi-words

chinese-dictionary chinese-words coprus nlp vocabulary

Last synced: 4 months ago
JSON representation

汉语常用词表

Awesome Lists containing this project

README

        

# 汉语常用词表

数据原始来源见 `txt` 文件开头部分,词表数据有修正、合并、去重等处理。

## 格式说明

文件格式如下,文件开头以# 开头的几行是注释

```tsv
# 资源名
# 原始资料等注释说明
#
# 如果是多列,这个是TSV格式列名,第一列应是词语

词语
词语 列2 列3
```

## 文件

### 词典类 `dict`

**简体中文**

- 现代汉语常用词表
- [x] 《现代汉语常用词表(草案)》2008 年
- [ ] 《现代汉语常用词表》(第 2 版,2021 年)
- 现代汉语词典
- [x] 《现代汉语词典》(第 7 版,2016 年)
- [x] 《现代汉语大词典》(阮智富 / 郭忠新主编,上海辞书出版社)
- [x] 《近代汉语词典》(白维国 主编,上海教育出版社)

**繁体中文**

- [x] 《中華語文大辭典》(2016 年)、《兩岸詞典》(兩岸差異用詞)
- 中華語文知識庫 https://www.chinese-linguipedia.org
- 中华语文知识库 https://www.zhonghuayuwen.org/ 【对应中国大陆简体版本】
- [x] 臺灣台語常用詞辭典

### 一般词表 `words`

- 汉语水平考试(HSK)
- [x] 【新版】共三等九级:汉语水平考试于 2010 年起改用六级分级制(初等和中等),即新 HSK;《国际中文教育中文水平等级标准》2021 年,新增 HSK 7-9 级(高等)
- [x] 【老版】甲乙丙丁四级:《中国汉语水平考试(HSK)办法》(1992 年发布);《汉语水平词汇与汉字等级大纲(HSK)》(2001 年修订)
- 异形词整理表
- [x] [《第一批异形词整理表》][moe-yixingci] 2001 年:338 组异形词以及【附录】含有非规范字的异形词(44 组)
- [x] 《第二批异形词(草案)》非正式文件
- [ ] 《现代汉语异形词规范手册》上海辞书出版社
- 在线词典数据

[moe-yixingci]: http://www.moe.gov.cn/jyb_sjzl/ziliao/A19/201001/t20100115_75687.html

### 专名词库

- 人名
- 地名