交叉熵似然函数

其他 2019-08-18 21:31:26 阅读次数: 0

交叉熵似然函数

转载自：https://zhuanlan.zhihu.com/p/70804197

信息熵

信息熵是消除不确定性所需信息量的度量
- 信息熵是信息的不确定程度
- 信息熵越小，信息越确定
\(信息熵=\sum\limits_{x=1}^n(信息x发生的概率\times{验证信息x所需信息量})\)
- 今年中国取消高考了，这句话我们很不确定(甚至心里还觉得这TM是扯淡)，那我们就要去查证了，这样就需要很多信息量(去查证)；反之如果说今年正常高考，大家回想：这很正常啊，不怎么需要查证，这样需要的信息量就很小。
根据信息的真实分布，我们能够找到一个最优策略，以最小的代价消除系统的不确定性，即最小信息熵
概率越低，需要越多的信息去验证，所以验证真假需要的信息量和概率成反比。我们需要用数学表达式把它描述出来，推导：

考虑一个离散的随机变量 $x$ ，已知信息的量度依赖于概率分布 $p(x)$ ，因此我们想要寻找一个函数 $I(x)$ ，它是概率 $p(x)$ 的单调减函数（因为\(p(x)\)越大，所需要的信息量就越小），表示信息量

怎么寻找呢？如果我们有两个不相关的事件 $x$ 和 $y$ ，那么观察两个事件同时发生时获得的信息量应该等于观察到事件各自发生时获得的信息之和，即：
$I(x,y)=I(x)+I(y)$

因为两个事件是独立不相关的，因此
$p(x,y)=p(x)p(y)$

根据这两个关系，很容易看出 $I(x)$ 一定与 $P(x)$ 的对数有关。
由对数的运算法则可知：
$log_a(p(x)p(y))=log_ap(x)+log_ap(y)$

因此，我们有
$I(x)=−log(p(x))$

其中负号是用来保证信息量是正数或者零。而 $log$ 函数基的选择是任意的（信息论中基常常选择为2，因此信息的单位为比特bits；而机器学习中基常常选择为自然常数，因此单位常常被称为奈特nats）。 $I(x)$ 也被称为随机变量 $x$ 的自信息 (self-information)，描述的是随机变量的某个事件发生所带来的信息量。

猜你喜欢

转载自www.cnblogs.com/doragd/p/11373959.html

交叉熵似然函数

熵、交叉熵及似然函数的关系

似然函数与最大似然估计、交叉熵概念与机器学习中的交叉熵函数

最大似然损失和交叉熵损失函数的联系

似然函数和最大似然估计与机器学习中的交叉熵函数之间的关系

交叉熵和极大似然

二次代价函数、交叉熵代价函数、对数似然代价函数选择

二项分布的对数似然函数与交叉熵（cross entropy）损失函数的联系

逻辑回归和线性回归,代价函数,交叉熵函数,极大似然估计

关于最大似然与交叉熵损失函数和最小二乘法的思考

深度学习（三）：最大似然率、损失函数与交叉熵

Logistic 回归Loss函数与交叉熵、极大似然估计关系

交叉熵（Cross-Entropy）与最大似然

二次代价函数、交叉熵(cross-entropy)、对数似然代价函数（log-likelihood cost）

【极大似然性】不同函数（均方误差、交叉熵、KL 散度）不同结局（1/2)

熵的相关概念及相互关系（信息熵，条件熵，相对熵，交叉熵，最大似然估计）

似然与似然函数

熵(Entropy),交叉熵(Cross-Entropy),KL-松散度(KL Divergence),似然（Likelihood）

极大似然估计与熵

深度学习中交叉熵和KL散度和最大似然估计之间的关系

最小二乘法、最大似然估计、交叉熵、贝叶斯

伯努利分布的最大似然估计（最小化交叉熵、分类问题）

交叉熵、KL散度、极大似然估计与最大后验估计

损失函数(交叉熵损失cross-entropy、对数似然损失、多分类SVM损失(合页损失hinge loss))、Softmax分类器和交叉熵损失cross-entropy

似然函数、最大似然估计

（pytorch进阶之路）交叉熵、信息熵、二分类交叉熵、负对数似然、KL散度、余弦相似度

似然函数的理解

最大似然函数

似然函数

【理解】似然函数

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)