https://github.com/shibing624/case-analysis
NLP之病历分析:从病历文本之中提取关键信息,便于后续分析处理。
https://github.com/shibing624/case-analysis
Last synced: 5 months ago
JSON representation
NLP之病历分析:从病历文本之中提取关键信息,便于后续分析处理。
- Host: GitHub
- URL: https://github.com/shibing624/case-analysis
- Owner: shibing624
- License: apache-2.0
- Created: 2017-02-12T02:19:25.000Z (over 8 years ago)
- Default Branch: master
- Last Pushed: 2017-02-12T07:27:48.000Z (over 8 years ago)
- Last Synced: 2024-11-02T08:11:39.510Z (11 months ago)
- Language: Java
- Size: 32 MB
- Stars: 19
- Watchers: 5
- Forks: 13
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# case-analysis
NLP之病历分析:从病历文本之中提取关键信息,便于后续分析处理。要求:
需求简单的概况就是从病历文本之中提取关键信息,命名实体识别,包括分词和词性标注提取关键信息(关键词数量),命名实体识别(这个有准确度问题的,哪些实体,现在知道包括病症名称、药品名称,其他不晓得了),包括分词和词性标注(主流词性要求+病症名称词性和药品词性区分开来?)
六大类实体
病症名称词性和药品词性要区分的
1.从一端文本之中抽取结构化的数据,比如从一段病历文本之中提取疾病、症状、药品、手术,或者从一端文本之中提取地名、公司名称。
2.识别出这些信息的关系。要求使用python语言实现,最好使用CRF(条件随机场)实现 。