Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/zhpmatrix/cged_tf
论文实现:《Chinese Grammatical Error Diagnosis with Long Short-Term Memory Networks》
https://github.com/zhpmatrix/cged_tf
cged grammatical-error-correction tensorflow
Last synced: about 7 hours ago
JSON representation
论文实现:《Chinese Grammatical Error Diagnosis with Long Short-Term Memory Networks》
- Host: GitHub
- URL: https://github.com/zhpmatrix/cged_tf
- Owner: zhpmatrix
- Created: 2018-08-16T10:27:38.000Z (about 6 years ago)
- Default Branch: master
- Last Pushed: 2019-03-15T14:13:40.000Z (over 5 years ago)
- Last Synced: 2023-10-25T20:44:29.266Z (about 1 year ago)
- Topics: cged, grammatical-error-correction, tensorflow
- Language: Python
- Homepage:
- Size: 82 KB
- Stars: 51
- Watchers: 2
- Forks: 16
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# CGED_TF
#### 整体思路
结合比赛本身提供的数据,可以将该问题建模为一个标注问题,例如命名实体识别等。NER的经典方案是BiLSTM+CRF。
#### 模型架构
![img](http://wx4.sinaimg.cn/mw690/aba7d18bgy1g13ty32x8fj20md0bmtbp.jpg)
#### 特征
输入特征为四个,分为三类:
(1) bigram特征,包括当前和前一时间步的bigram特征
(2) pos特征: 特征提取工具使用哈工大的LTP,任何其他开源工具都可以,目的是做词性标注
(3) char特征
#### 围绕该工作,我的相关博客
[中文拼写纠错-和百度比一比](https://zhpmatrix.github.io/2019/02/01/rethinking-spellchecker/),这篇博客主要和百度AI平台开放的中文纠错API的结果对比,同时给出了如何接入API的方法。
[中文拼写纠错](https://zhpmatrix.github.io/2018/12/17/chinese-spell-checker/),这篇博客简单的梳理了围绕该课题做的相关工作。
[复现论文地址](https://pdfs.semanticscholar.org/c1d3/954b4b1951c8584d7feab94115b4816b577f.pdf?_ga=2.257663115.1623131418.1552658691-1526348929.1541338252),需要说明的是实现代码的评估指标并没有完全达到论文指标,需要继续调优。