对话系统学习笔记

关键知识参考：

https://blog.csdn.net/liuchonge/article/details/79104045

评价指标

包括：重叠词评价指标、词向量评价指标、困惑度。

重叠词

认为，对话提问的回答，应该是发散的，词汇不应该重叠过多。评价方法有：

重叠词评价方法

BLEU
常作为机器翻译评价指标，在重叠词中的应用，是最多的。

https://blog.csdn.net/guolindonggld/article/details/56966200

ROUGE 常作为文本摘要评价指标

METEOR 基于BLEU做一些改进

词向量

评价word2vec sent2vec doc2vec等

词向量评价方法

greedy matching
基于贪心算法的思想，贪婪地不放回地生成一个虚拟对照组的方法。

https://blog.csdn.net/Noob_daniel/article/details/76546723

Embedding Average 使用余弦相似度来计算两个句向量的相似度。

Vector Extrema

perplexity困惑度

评价语言模型的好坏，输出的句子是否是人话。

人工指标

闲聊数据，反应如何

技术类数据，反应如何等

重叠词评价方法
BLEU	常作为机器翻译评价指标，在重叠词中的应用，是最多的。 https://blog.csdn.net/guolindonggld/article/details/56966200
ROUGE	常作为文本摘要评价指标
METEOR	基于BLEU做一些改进

词向量评价方法
greedy matching	基于贪心算法的思想，贪婪地不放回地生成一个虚拟对照组的方法。 https://blog.csdn.net/Noob_daniel/article/details/76546723
Embedding Average	使用余弦相似度来计算两个句向量的相似度。
Vector Extrema

对话系统学习笔记

评价指标

重叠词

perplexity困惑度

人工指标

猜你喜欢