语言模型评估方法Perplexity

其他 2020-03-30 21:04:02 阅读次数: 0

语言模型评估方法Perplexity

更多内容: https://github.com/fansking/NlpWithMe
如何评估一个语言模型的好坏呢？一个好的语言模型，对正常的句子和错误的句子的生成概率应该是有差异的。例如：老鼠爱吃大米与爱老鼠大米吃。这两个句子分别放入语言模型中，第一个句子的生成概率应该较大。

困惑度（perplexity）的基本思想是：给测试集的句子赋予较高概率值的语言模型较好,当语言模型训练完之后，测试集中的句子都是正常的句子，那么训练好的模型就是在测试集上的概率越高越好

$PP(W)=P(w_{1}w_{2}...w_{N})^{-\frac{1}{N}}=\sqrt[N]{\frac{1}{P(w_{1}w_{2}...w_{N})}}$

而根据n-gram模型， $P(w_{1}w_{2}...w_{N})$ 是可以算出来的（最大似然概率）

注意这里 $w_{1}w_{2}...w_{N}$ 是对句子分词得到的单词序列，N是单词总个数，由于加了负数的次方，故句子概率越大，语言模型越好，困惑度也即perplexity越小。

fans king

发布了16 篇原创文章 · 获赞 3 · 访问量 1357

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_40631132/article/details/104741263

语言模型评估方法Perplexity

语言模型评价指标Perplexity

N-gram语言模型 & Perplexity & 平滑

人工智能-自然语言处理(NLP)：N-gram语言模型【用来判断一句话语法上是否通顺】 --＞语言模型的评估【Perplexity（困惑度） --＞利用语言模型生成新句子】

LLM(大语言模型)常用评测指标-困惑度（Perplexity）

大语言模型评估全解：评估流程、评估方法及常见问题

语言模型评估与类别

语言模型评估标准

语言模型的评估

模型评估方法

分类模型评估方法

sklearn评估模型的方法

模型评估常用方法

分类模型的评估方法

Language Model perplexity by using tensorflow使用tensorflow RNN模型计算语言模型的困惑度

一文详解NGram语言模型以及困惑度perplexity

Perplexity：深入理解语言模型评价指标——困惑度

【机器学习】模型评估方法

机器学习模型评估方法

模型评估方法（混淆矩阵）

机器学习的模型评估方法

常用模型评估方法总结

构建语言模型（二）：模型训练与评估

sklearn模型选择--模型评估方法

R语言笔记之模型评估度量

深度学习：语言模型的评估标准

如何评估大型语言模型（LLM）？

大语言模型（LLM）评估综述

LLM：预训练语言模型的评估

模型评估的方法： ROC,AUC,RMSE等指标

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)