交叉熵、KL散度问题。 - 代码天地

交叉熵、KL散度问题。

其他 2020-03-23 17:45:01 阅读次数: 0

最近在研究GAN算法。这其中使用了KL散度等一些概念问题。在网上发现了一个很精彩的解释。

目前分类损失函数为何多用交叉熵，而不是KL散度。

首先损失函数的功能是通过样本来计算模型分布与目标分布间的差异，在分布差异计算中，KL散度是最合适的。但在实际中，某一事件的标签是已知不变的（例如我们设置猫的label为1，那么所有关于猫的样本都要标记为1），即目标分布的熵为常数。而根据下面KL公式可以看到，KL散度 - 目标分布熵 = 交叉熵（这里的“-”表示裁剪）。所以我们不用计算KL散度，只需要计算交叉熵就可以得到模型分布与目标分布的损失值。

从上面介绍，知道了模型分布与目标分布差异可用交叉熵代替KL散度的条件是目标分布为常数。如果目标分布是有变化的（如同为猫的样本，不同的样本，其值也会有差异），那么就不能使用交叉熵，例如蒸馏模型的损失函数就是KL散度，因为蒸馏模型的目标分布也是一个模型，该模型针对同类别的不同样本，会给出不同的预测值（如两张猫的图片a和b，目标模型对a预测为猫的值是0.6，对b预测为猫的值是0.8）。

注：交叉熵和KL散度应用方式不同的另一种解释（我更倾向于上面我自己的解释，更具公式解释性）：

交叉熵：其用来衡量在给定的真实分布下，使用非真实分布所指定的策略消除系统的不确定性所需要付出的努力的大小。这也是为什么在机器学习中的分类算法中，我们总是最小化交叉熵，因为交叉熵越低，就证明由算法所产生的策略最接近最优策略，也间接证明我们算法所算出的非真实分布越接近真实分布。

KL散度（相对熵）：衡量不同策略之间的差异呢，所以我们使用KL散度来做模型分布的拟合损失。

我在这里就引用这么多了。大家要看全部的到知乎上面交叉熵、相对熵（KL散度）、JS散度和Wasserstein距离（推土机距离）

这个地方去看原版的。

skyfengye

发布了88 篇原创文章 · 获赞 55 · 访问量 16万+

私信关注

猜你喜欢

转载自blog.csdn.net/nijiayan123/article/details/97267302

交叉熵、KL散度问题。

交叉熵与KL散度

交叉熵，KL散度等

熵、KL散度和交叉熵

熵、交叉熵、KL散度、JS散度

KL散度与交叉熵区别与联系

交叉熵 vs KL散度

损失函数--KL散度与交叉熵

【机器学习】交叉熵与KL散度

香农熵、相对熵（KL散度）与交叉熵

KL散度、JS散度以及交叉熵对比

交叉熵、KL散度、JS散度

KL散度、JS散度、交叉熵

交叉熵和相对熵(KL散度)

信息熵，交叉熵，KL散度（机器学习笔记）

【机器学习基础】熵、KL散度、交叉熵

自信息,KL散度(相对熵),交叉熵

KL散度(相对熵)、交叉熵的解析

交叉熵与KL散度（相对熵）总结比较

面试准备---- 交叉熵，相对熵（KL散度），softmax

交叉熵、(KL散度)相对熵、互信息

信息量、信息熵、KL散度、交叉熵

机器学习中的信息熵、KL散度、交叉熵

[机器学习]——信息、信息熵、KL散度、交叉熵

信息量、相对熵（KL散度）、交叉熵

信息熵、交叉熵、KL散度公式的简单理解

KL散度和交叉熵的对比介绍

熵[1]—熵、交叉熵、相对熵（KL散度）的关系

机器学习、深度学习中的信息熵、相对熵（KL散度）、交叉熵、条件熵

信息论相关概念：熵交叉熵 KL散度 JS散度

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)