【深度学习】K-L 散度 - 代码天地

【深度学习】K-L 散度

其他 2019-10-12 00:17:24 阅读次数: 0

K-L 散度

K-L 散度

K-L 散度在信息系统中称为相对熵，可以用来量化两种概率分布 P 和 Q 之间的差异，它是非对称性的度量。在概率学和统计学上，我们经常会使用一种更简单的、近似的分布来替代观察数据或太复杂的分布。K-L散度能帮助我们度量使用一个分布来近似另一个分布时所损失的信息量。一般情况下，P 表示数据的真实分布，Q 表示数据的理论分布，估计的模型分布或者 P 的近似分布。

K-L 散度定义

Note：KL 散度仅当概率 \(P\) 和 \(Q\) 各自总和均为1，且对于任何 \(i\) 皆满足 \(Q(i)>0\) ， \(P(i)>0\) 时，才有定义。

离散随机变量：
\[ D_{KL}(P||Q) = - \sum_i P(i) \ln \frac{Q(i)}{P(i)} = \sum_i P(i) \ln \frac{P(i)}{Q(i)} \]
连续随机变量：
$$

$$

对比两种分布

假设真实分布为 \(P\)，\(P\) 的两个近似分布为 \(Q_1, Q_2\)，对于这两个近似分布我们应该选择哪一个？K-L 散度可以解决这个问题：如果 \(D_{KL}(P||Q_1) < D_{KL}(P||Q_2)\)，那么我们选择 \(Q_1\) 作为 \(P\) 的近似分布。

散度并非距离

我们不能把 K-L 散度看作是两个分布之间距离的度量。首先距离度量需要满足对称性，但是 K-L 散度不具备对称性，即：
\[ D_{KL}(P||Q) \neq D_{KL}(Q||P) \]

Q1：信息熵，交叉熵，相对熵的区别是什么？

A1：（1）信息熵，即熵，是编码方案完美时的最短平均编码长度；（2）交叉熵，即 Cross Entropy，是编码方案不一定完美时（对概率分布的估计不一定正确）的平均编码长度，在神经网络中常用作损失函数；（3）相对熵，即 K-L 散度，是编码方案不一定完美时，平均编码长度相对于最短平均编码长度的增加值。

Q2：为什么在深度学习中使用 Cross Entropy 损失函数，而不是 K-L 散度？

A2：因为 K-L 散度 = 交叉熵 - 熵，即 \(D_{KL}(p||q) = H(p,q)-H(p)\)，在神经网络所设计的范围内，\(H(p)\) 不变，则 \(D_{KL}(p||q)\) 等价于 \(H(p,q)\)。

References:

[1] 如何理解K-L散度（相对熵）

[2] 相对熵——维基百科

猜你喜欢

转载自www.cnblogs.com/xxxxxxxxx/p/11657820.html

【深度学习】K-L 散度

K-L 散度

K-L散度（相对熵）的理解

熵、相对熵(K-L散度)、交叉熵

机器学习---常见的距离公式（欧氏距离、曼哈顿距离、标准化欧式距离、余弦距离、杰卡德距离、马氏距离、切比雪夫距离、闵可夫斯基距离、K-L散度）

深度学习之KL散度

机器学习中的距离/散度/熵

【机器学习】交叉熵与KL散度

机器学习：KL散度详解

【学习记录】KL散度的定义

图像的K-L变换

初学机器学习：直观解读KL散度的数学概念

初学机器学习——直观解读KL散度的数学概念

信息熵，交叉熵，KL散度（机器学习笔记）

机器学习：Kullback-Leibler Divergence （KL 散度）

【机器学习基础】熵、KL散度、交叉熵

机器学习之Kullback-Leibler Divergence （KL 散度）

机器学习中的信息熵、KL散度、交叉熵

[机器学习]——信息、信息熵、KL散度、交叉熵

【机器学习】KL-divergence（KL散度）的理解

机器学习-KL散度的直观理解+代码

散度

机器学习、深度学习中的信息熵、相对熵（KL散度）、交叉熵、条件熵

深度学习剖根问底：交叉熵和KL散度的区别

深度学习中交叉熵和KL散度和最大似然估计之间的关系

深度学习（一）：交叉熵损失函数，信息量，熵，KL散度

Pytorch神经网络实战学习笔记_28 信息熵与互信息：联合熵+条件熵+交叉熵+相对熵/KL散度/信息散度+JS散度

KL散度与反向KL散度

入门 | 初学机器学习：直观解读KL散度的数学概念

机器学习基础（五十八）—— 香农熵相对熵（KL散度）与交叉熵

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)