Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/krystalan/SGSum
CCKS‘2021:《SGSum:一个面向体育赛事摘要的人工标注数据集》
https://github.com/krystalan/SGSum
dataset paper
Last synced: about 1 month ago
JSON representation
CCKS‘2021:《SGSum:一个面向体育赛事摘要的人工标注数据集》
- Host: GitHub
- URL: https://github.com/krystalan/SGSum
- Owner: krystalan
- Created: 2021-05-13T08:26:45.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2021-12-26T09:55:14.000Z (almost 3 years ago)
- Last Synced: 2024-08-03T09:07:12.949Z (5 months ago)
- Topics: dataset, paper
- Homepage:
- Size: 315 KB
- Stars: 24
- Watchers: 2
- Forks: 6
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- StarryDivineSky - krystalan/SGSum
README
**************************** **更新** ****************************
- 2021/12/26 我们的论文《SGSum:一个面向体育赛事摘要的人工标注数据集》入选CCKS 2021 Best Paper Candidates。
- 2021/12/21 SGSum对应的海报以及相关推送介绍已经发布在[这里](https://hub.baai.ac.cn/view/13211);更新了常见问题与回答,请见文末。
- 2021/12/4 你可以访问[这里](https://wangjiaan.cn/files/SGSum.pdf)来查看我们的原始论文。需要注意的是本届CCKS不对中文论文进行正式发表,而是推荐到中文核心期刊进行发表,**因此我们的论文并未正式发表**。
- 2021/7/29 我们的论文《SGSum:一个面向体育赛事摘要的人工标注数据集》入选CCKS 2021 Oral Paper。
- 2021/7/2 我们的论文《SGSum:一个面向体育赛事摘要的人工标注数据集》被CCKS 2021录用为资源类(Resource Track)论文。## SGSum
#### 简介**SGSum**是一个经过人工清洗的大规模高质量体育赛事摘要数据集。包含7854条体育赛事摘要数据,每条数据包括一场赛事的在线评论文本与新闻文本。
该数据集仅限学术研究使用。
#### 数据集
请使用[讯飞云](http://pan.iflytek.com:80/link/C91C8827872D98DB78E6F25B8E94FCD3)(密码FECv)或[百度网盘](https://pan.baidu.com/s/1rWUTRi3dPdwmXhRD_UjLPQ)(密码p51j)下载数据文件共包含三个文件:
* ```train.json```: 训练集
* ```valid.json```: 验证集
* ```test.json```: 测试集每个json文件的格式如下所示:
```
[
{
"_id" : "183",
"level" : "hard",
"commentary": [["1'", "都灵球员萨沙·卢基奇一脚直塞球给Juan Iturbe,但是边裁举旗显示后者已经越位.", "0-0"], ["2'", "国际米兰球员加格里亚迪尼大禁区外尝试左脚射门,可惜皮球偏出球门.", "0-0"], ["5'", "国际米兰球员伊卡尔迪大禁区中央右脚射门,被防守球员封堵.给他传球的是坎德雷瓦.", "0-0"],...],
"news": "开场5分钟,坎德雷瓦中路长传,伊卡尔迪在门前14米处停球射门被封堵..."
},
{
"_id": "288",
"level": "hard",
"commentary": [["2'", "利物浦球员杰拉德大禁区外右脚射门,被防守球员封堵.给他传球的是沙辛.", "0-0"], ["2'", "纽卡斯尔球员安尼塔拼抢犯规,对手获得控球权.", "0-0"],...],
"news": "开场前4分钟,杰拉德两度外围射门均被封堵。第5分钟,苏亚雷斯禁区边缘内转身挑球突破科洛奇尼时被抢断..."
},
...
]
```
备注:"level"字段中的"hard"代表“丰富类”; "medium"对应“中等类”; "easy"对应“简短类”## Q&A
Q1: 如何构建基线模型?
A1: 我们计划元旦之前 (the author is too busy right now),在[这里](https://github.com/krystalan/K-SportsSum)公布一个构建基线模型的教程,希望可以帮到你!Q2: 体育赛事摘要还有哪些值得研究的方向?
A2: 我们在最新推文[《原创成果丨体育赛事摘要任务概览》](https://mp.weixin.qq.com/s/EidRYB_80AhRclz-mryVhQ)中总结了体育赛事摘要的未来方向,希望能够对你有所启发!Q3: 任何想法或意见?
A3: Please feel free to contact me! (jawang1[at].stu.suda.edu.cn)