1.BLEU
主要任务是为了将候选的n-gram和target的n-gram相比较,匹配相似度(与位置无关)
基本做法:比较翻译结果中和参考的n-gram个数,直接相除,问题是长句子会得分更高,限制句子长度加入惩罚参数,同时对不同的目标任务对n-gram赋予不同的权重
1.BLEU
主要任务是为了将候选的n-gram和target的n-gram相比较,匹配相似度(与位置无关)
基本做法:比较翻译结果中和参考的n-gram个数,直接相除,问题是长句子会得分更高,限制句子长度加入惩罚参数,同时对不同的目标任务对n-gram赋予不同的权重