https://github.com/keyu-tian/marcov_qa

Last synced: 3 months ago
JSON representation

Host: GitHub
URL: https://github.com/keyu-tian/marcov_qa
Owner: keyu-tian
Created: 2021-07-12T13:51:52.000Z (almost 4 years ago)
Default Branch: main
Last Pushed: 2021-07-12T14:32:56.000Z (almost 4 years ago)
Last Synced: 2025-01-06T22:35:40.019Z (5 months ago)
Language: Python
Size: 2.4 MB
Stars: 1
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

## 最终排名：冠军

### 比赛介绍

* 比赛名称：科技战役-疫情政务问答助手
* [比赛链接](https://www.datafountain.cn/special/BJSJ/talent)

* 疫情政务问答助手比赛提供以疫情相关的**政策数据集**、用户问题以及标注好的答案，其中答案片段一定出现在政策数据集中，因此可以认为答案一定是文档中的一个片段（span）
* 本队将该赛题看成多文档阅读理解任务（Multi-Document Machine Reading Comprehension, MDMRC），这一问题已经在学术界有了较多的研究。大部分的研究将MDMRC分解为文档检索任务和抽取型阅读理解任务，**其中文档检索任务在文档库中检索到和问题最相关的若干文档，抽取型阅读理解任务在从检索到的文档中抽取问题对应的答案片段**。这种框架形式较为灵活，可以在不同的子任务中尝试不同的方法，然后再将子任务的结果组合得到最终答案。

### 队伍介绍

* 队伍名称：中国加油-湖北加油
* 成员介绍
* 陆华、钟嘉伦和王力来自**华中科技大学Dian团队AI实验室**，组内研究方向包括自然语言处理、计算机视觉等。
* 余嘉豪是**北京邮电大学**本科三年级在读生，现在在**北京大学王选计算机研究所**严睿老师团队下实习，该团队致力于人机对话、认知计算等自然语言处理方向的研究。
* 张原来自**北京来也网络科技有限公司**。北京来也网络科技有限公司创办于2015年，致力于做人机共生时代具备全球影响力的智能机器人公司）。

### 方法概要

* 本队采用了**文档检索-阅读理解框架**，使用了预训练模型、**召回优化**、**负样本选择策略**、**多任务训练**等方法辅助模型训练，最后通过模型融合得到了在测试集(A榜)0.744的Rouge-L分数，**排名第一**，验证了自然语言处理可以有效应用于实际生活中。

### ppt分享

* 本队的答辩ppt已上传，供大家学习交流（时间匆忙，所以ppt制作得比较粗糙）

### 比赛结果

* A榜和B榜得分均top1

*
B榜排名
A榜排名

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/keyu-tian/marcov_qa

Awesome Lists containing this project

README