Evaluaion mark in natural language processing field//updating

1.Bleu

Bleu[1]是IBM在2002提出的,用于机器翻译任务的评价,发表在ACL,引用次数10000+,原文题目是“BLEU: a Method for Automatic Evaluation of Machine Translation”。

它的总体思想就是准确率,假如给定标准译文reference,神经网络生成的句子是candidate,句子长度为n,candidate中有m个单词出现在reference,m/n就是bleu的1-gram的计算公式。

BLEU还有许多变种。根据n-gram可以划分成多种评价指标,常见的指标有BLEU-1、BLEU-2、BLEU-3、BLEU-4四种,其中n-gram指的是连续的单词个数为n。

BLEU-1衡量的是单词级别的准确性,更高阶的bleu可以衡量句子的流畅性。

BLEU详解 - 知乎

2.n-gram

N-gram算法_Rnan-prince的博客-CSDN博客_n-gram计算

自然语言处理中N-gram_张弓天道的博客-CSDN博客_n-gram 

猜你喜欢

转载自blog.csdn.net/weixin_43332715/article/details/124353742