Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/onewaymyway/DuEE_2020
2020语言与智能技术竞赛:事件抽取任务方案代码
https://github.com/onewaymyway/DuEE_2020
Last synced: 7 days ago
JSON representation
2020语言与智能技术竞赛:事件抽取任务方案代码
- Host: GitHub
- URL: https://github.com/onewaymyway/DuEE_2020
- Owner: onewaymyway
- Created: 2020-06-14T06:48:54.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2023-02-16T01:41:17.000Z (over 1 year ago)
- Last Synced: 2024-08-02T16:55:52.363Z (3 months ago)
- Language: Python
- Size: 40 KB
- Stars: 28
- Watchers: 3
- Forks: 8
- Open Issues: 5
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 事件抽取模型(基于paddlehub)
本模型在官方PaddleHub版本上进行修改得到
官方原版地址:https://github.com/PaddlePaddle/Research/tree/master/KG/DuEE_baseline/DuEE-PaddleHub本方案github地址:https://github.com/onewaymyway/DuEE_2020
本方案在官方baseline的基础上的改动
1.在网络结构上在CRF层前面增加了双向GRU层(代码见sequence_label.py中SequenceLabelTaskSP类)
2.将trigger预测结果拼接到text前面进行第二阶段的role预测(代码见data_process.py的data_process函数中model=role1的情况),这个改动可以解决同一个句子不同event之间role重叠的问题
3.在训练上,本方案先只用train进行训练,然后再将dev放入train进行最后的训练
4.增加了简单的最终结果剔除机制(代码见datachecker.py)
建议使用AIStudio环境跑这个项目,最好是直接Fork本人分享的项目,
项目地址:https://aistudio.baidu.com/aistudio/projectdetail/545914
### 环境准备
- python适用版本 2.7.x(本代码测试时使用依赖见 ./requirements.txt )
- paddlepaddle-gpu >= 1.7.0、paddlehub >= 1.6.1
- 请转至paddlepaddle官网按需求安装对应版本的paddlepaddle#### 依赖安装
> pip install -r ./requirements.txt### 模型训练
各个步骤在notebook文件里(project.ipynb)都有详细说明
按照notebook的顺序执行就可以了,这里就不详细说明了