https://github.com/zhpmatrix/lic2019-competition

2019语言与智能技术竞赛-基于知识图谱的主动聊天
https://github.com/zhpmatrix/lic2019-competition

chatbot dialogue-systems knowledge-graph lic2019

Last synced: about 1 year ago
JSON representation

2019语言与智能技术竞赛-基于知识图谱的主动聊天

Host: GitHub
URL: https://github.com/zhpmatrix/lic2019-competition
Owner: zhpmatrix
Created: 2019-02-27T08:44:50.000Z (over 7 years ago)
Default Branch: master
Last Pushed: 2019-05-24T10:48:40.000Z (about 7 years ago)
Last Synced: 2025-04-12T23:11:19.644Z (about 1 year ago)
Topics: chatbot, dialogue-systems, knowledge-graph, lic2019
Language: Python
Size: 37.1 KB
Stars: 115
Watchers: 7
Forks: 29
Open Issues: 2
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

#### 一. 任务形式化

这个赛道的目标是设立基于知识图谱的主动聊天任务。[知识驱动对话-官网地址](http://lic2019.ccf.org.cn/talk)

##### 输入:

对话目标g，其中g=START->TOPIC\_A->TOPIC\_B;表示机器从冷启动状态主动聊到话题A，然后聊到话题B。意味着在该任务中，由机器主动的引导对话；在该任务中，具体的话题包括电影和娱乐人物主体。

相关知识信息M，其中M=f1,f2,...,fn. 包括三类，分别是：话题A的知识信息，话题B的知识信息，话题A和话题B的关联信息。在该任务中，具体的相关知识信息包括电影票房，导演和评价等，以SPO形式表示。也就是(Subject, Predicate, Object)，即(实体一，谓词，实体二)。

当前对话序列H=u1,u2,...u(t-1)

##### 输出：

机器回复ut.

#### 二.数据介绍(见官方网站)

#### 三.评价方法

自动评估指标和人工评估指标结合。自动评估指标考虑三个层面的度量，分别是字级别(F1-score)，词级别(BLEU)和回复多样性(DISTINCT)。关于回复多样性，还是基于词的计算，不过考察的是生成词的另外一个维度。在参考2中作者这样写道：

_distinct-1 and distinct-2
are respectively the number of distinct unigrams and bigrams divided by total number of generated words_

#### 四.一般流程

参考PyTorch官方提供的tutorial(见参考4)，从seq2seq的角度解决问题的方法是，将多轮对话拆分成平行句。例如，针对当前对话序列H=u1,u2,...u(t-1)，可以拆分成t-2组样本，分别是：u1->u2;u2->u3;...;u(t-2)->u(t-1);但是，这样的划分方式存在明显的问题是：句子之间的平滑。这应该是一个问题，但是还没有深入思考过。

#### 五.想法实现

目前，重构了PyTorch官方的Chatbot的Tutorial代码，将各个模块解耦出来，顺带发现了一个Bug。在此基础上，准备实现一个baseline，[代码地址](https://github.com/zhpmatrix/lic2019-competition)

实现思路上，主要参考论文《A Knowledge-Grounded Neural Conversation Model》,包括两个主要部分：

第一：如何将知识图谱的信息嵌入到模型中；

第二: memory机制的实现；

补充：

IJCAI16的文章《Neural Generative Question Answering》的3.2节提出了两种方式用于输入和KG的交互：

第一: Bilinear Model

第二: CNN-based Matching Model

参考：

0.www2018,《DKN: Deep Knowledge-Aware Network for News Recommendation》

1.[第六届全国社会媒体处理大会-SMP2017中文人机对话技术评测(ECDT)](http://ir.hit.edu.cn/SMP2017-ECDT)

包含两个任务：用户意图领域分类和特定域任务型人机对话在线评测

2.《A Diversity-Promoting Objective Function for Neural Conversation Models》

3.《A Persona-Based Neural Conversation Model》

4.[chatbot tutorial with pytorch](https://pytorch.org/tutorials/beginner/chatbot_tutorial.html)

5.[2018JDDC的对话比赛亚军方案](https://github.com/Dikea/Dialog-System-with-Task-Retrieval-and-Seq2seq)

6.[机器如何猜你所想？阿里小蜜预测平台解密](https://102.alibaba.com/detail?id=193)

7.[拆开阿里小蜜的内核，看智能人机交互的实现逻辑](https://102.alibaba.com/detail?id=114)

8.[一文揭秘！自底向上构建知识图谱全过程
](https://102.alibaba.com/detail?id=134)

9.[为电商而生的知识图谱，如何感应用户需求？](https://102.alibaba.com/detail?id=179)

10.[健康知识图谱，阿里工程师如何实现？
](https://102.alibaba.com/detail?id=176)

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/zhpmatrix/lic2019-competition

Awesome Lists containing this project

README