对话系统学习笔记

关键知识参考:

https://blog.csdn.net/liuchonge/article/details/79104045

 

评价指标

包括:重叠词评价指标、词向量评价指标、困惑度。

 

重叠词

认为,对话提问的回答,应该是发散的,词汇不应该重叠过多。评价方法有:

重叠词评价方法  
BLEU

常作为机器翻译评价指标,在重叠词中的应用,是最多的。

https://blog.csdn.net/guolindonggld/article/details/56966200

ROUGE 常作为文本摘要评价指标
METEOR 基于BLEU做一些改进

 

 

 

 

 

词向量

评价word2vec sent2vec doc2vec等

词向量评价方法  
greedy matching

基于贪心算法的思想,贪婪地不放回地生成一个虚拟对照组的方法。

https://blog.csdn.net/Noob_daniel/article/details/76546723

Embedding Average 使用余弦相似度来计算两个句向量的相似度。
Vector Extrema  

 

 

 

 

 

perplexity困惑度

评价语言模型的好坏,输出的句子是否是人话。

人工指标

闲聊数据,反应如何

技术类数据,反应如何等

猜你喜欢

转载自blog.csdn.net/a274767172/article/details/84568202