困惑度 perplexity - 代码天地

困惑度 perplexity

编程语言 2020-02-26 13:04:46 阅读次数: 0

在自然语言处理中，困惑度是用来衡量语言模型优劣的一个方法。它的值是对交叉熵损失函数做指数运算后得到的结果。

交叉熵损失函数

单个训练样本的损失：

$loss=-\frac{1}{n}\sum_{i=1}^{n}y_{i}log\hat{y_{i}}=-log\hat{y_{j}}$

$n$ 是标签数量，在语言模型中指的是字符总数。 $\hat{y_{i}}$ 是预测概率， $y_{i}$ 是预测正确概率。假如标签数为3，每个样本只有一个标签，正确预测结果为类别1，则 $y_{1}=1$ ， $y_{2}=0$ ， $y_{3}=0$ ，代入公式得到 $loss=-log\hat{y_{1}}$ 。可以看到交叉熵损失函数只关心预测正确的概率。

困惑度

$perplexity=e^{loss}=\frac{1}{\hat{y_{i}}}$

最佳情况下，模型总是把标签类别的概率预测为1，此时困惑度为1；
最坏情况下，模型总是把标签类别的概率预测为0，此时困惑度为正无穷；
基线情况下，模型总是预测所有类别的概率都相同。 $\hat{y_{i}}=\frac{1}{n}$ ， $perplexity=n$ 。此时困惑度为类别个数。
显然，任何一个有效模型的困惑度必须小于类别个数。在语言模型中，困惑度必须小于词典大小vocab_size。

qsmx666

发布了13 篇原创文章 · 获赞 0 · 访问量 309

私信关注

猜你喜欢

转载自blog.csdn.net/qsmx666/article/details/104514206

困惑度 perplexity

NLP 之 Perplexity困惑度

如何计算文本的困惑度perplexity(ppl)

LDA困惑度perplexity的一些个人理解

LLM(大语言模型)常用评测指标-困惑度（Perplexity）

Language Model perplexity by using tensorflow使用tensorflow RNN模型计算语言模型的困惑度

python下进行lda主题挖掘(三)——计算困惑度perplexity

一文详解NGram语言模型以及困惑度perplexity

LDA主题模型绘制困惑度（perplexity）-主题数曲线——python

Perplexity：深入理解语言模型评价指标——困惑度

人工智能-自然语言处理(NLP)：N-gram语言模型【用来判断一句话语法上是否通顺】 --＞语言模型的评估【Perplexity（困惑度） --＞利用语言模型生成新句子】

gensim---LDA---perplexity

(python )LDA perplexity计算

LDA perplexity计算

困惑度计算

语言模型评价指标Perplexity

语言模型评估方法Perplexity

N-gram语言模型 & Perplexity & 平滑

使用gensim实现lda，并计算perplexity（ gensim Perplexity Estimates in LDA Model）

自然语言处理 —— 困惑度

困惑

搜索神器Perplexity的详细使用方法(持续更新)

NLP 的 Task 和 Metric (Perplexity，BLEU，METOR，ROUGH，CIDEr)

人机文本分类特征构造——困惑度计算

深度学习 pytorch 困惑度计算方法

计算perplexity确定LDA到底聚出多少个主题合适

生成式 AI 搜索引擎 Perplexity 融资 7360 万美元

A.深度学习基础入门篇[二]：机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解

神奇智能搜索引擎：perplexity智能搜索引擎（ChatGPT与Edge合体——联网版chatGPT）

NewBing、Andi、Phind、Perplexity 还有国产kuaisou五个AI搜索引擎的介绍和对比

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)