交叉熵在机器学习中的使用 - 代码天地

交叉熵在机器学习中的使用

其他 2019-07-29 11:41:30 阅读次数: 0

交叉熵在机器学习中的使用

1、信息量

概率越小，信息量越大，事件$X=x_0$的信息量为：
$$I(x_0)=-log(p(x_0))$$

2、熵

熵表示所有信息量的期望：
$$H(x)=-\sum_{i=1}^n p(x_i)log(p(x_i))$$
其中n代表事件X有n种可能

3、相对熵（KL散度）

$$D_{KL}(p||q)=\sum_{i=1}^np(x_i)log(\frac{p(x_i)}{q(x_i)}$$
物理意义：如果用P来描述目标问题，而不是用Q来描述问题，得到的信息增量

在机器学习中，P往往表示样本的真实分布，q表示模型预测的分布，相对熵越小，表示q分布和p分布越接近

4、交叉熵

相对熵可以变形为：
$$D_{KL}(p||q)=-H(p(x))+[-\sum_{i=1}^np(x_i)log(q(x_i))]$$
等式的前半部分是p的熵，后半部分就是交叉熵：
$$H(p,q)=-\sum_{i=1}^np(x_i)log(q(x_i))$$
在机器学习中，我们需要评估labl和predicts之间的差距，可以使用KL散度，但由于KL散度前半部分不变，故在优化过程中，只需要关注交叉熵就行，所以一般在机器学习中直接用交叉熵作为loss函数，评估模型。

机器学习中交叉熵的应用

1、为什么用交叉熵做loss函数

在线性回归中，常常用MSE作loss函数；但在逻辑分类中却不好用，这是需要用交叉熵

2、交叉熵在单分类中的使用

这里的单类别指：每个样本只能有一个类别
交叉熵在单分类问题上的loss函数：
$$loss=-\sum_{j=1}^m\sum_{i=1}^ny_{ji}log(\hat{y}_{ji})$$
这里的预测概率是通过softmax计算，概率合为1

3、交叉熵在多分类中使用

这里的多类别指：每个样本可以有多个类别
交叉熵在多分类问题上的loss问题：
$$loss=\sum_{j=1}^m\sum_{i=1}^n-y_{ji}log(\hat{y}{ji})-(1-y{ji})log(1-\hat{y}_{ji})$$
这里的预测是通过sigmoid计算，每个label都是独立分布的，输出归一化

猜你喜欢

转载自www.cnblogs.com/yzh1024/p/11262900.html

交叉熵在机器学习中的使用

机器学习中的交叉熵

一文搞懂交叉熵在机器学习中的使用

【机器学习】交叉熵函数的使用及推导

机器学习中的信息熵、KL散度、交叉熵

一文搞懂交叉熵在机器学习中的使用，透彻理解交叉熵背后的直觉

机器学习、深度学习中的信息熵、相对熵（KL散度）、交叉熵、条件熵

详解机器学习中的熵、条件熵、相对熵和交叉熵

【转】详解机器学习中的熵、条件熵、相对熵和交叉熵

机器学习中的熵、条件熵、相对熵和交叉熵

机器学习-交叉熵原理

似然函数与最大似然估计、交叉熵概念与机器学习中的交叉熵函数

详细剖析机器学习中的损失函数---交叉熵

2.20机器学习：交叉熵信息熵相对熵

从熵、相对熵、交叉熵到机器学习的交叉熵损失与softmax损失函数

机器学习 [交叉熵损失函数]

【机器学习】交叉熵与KL散度

机器学习什么是Cross Entropy 交叉熵

信息熵，交叉熵，KL散度（机器学习笔记）

【机器学习基础】熵、KL散度、交叉熵

[机器学习]——信息、信息熵、KL散度、交叉熵

机器学习笔记-信息熵、条件熵、相对熵、交叉熵和互信息

机器学习之路：tensorflow 深度学习中分类问题的损失函数交叉熵

深度学习中交叉熵的理解

深度学习使用交叉熵代价的好处

机器学习中的基本问题——log损失与交叉熵的等价性

似然函数和最大似然估计与机器学习中的交叉熵函数之间的关系

深度理解交叉熵的含义以及在机器学习中的应用

机器学习算法基础：熵、联合熵、条件熵、信息增益、相对熵（KL散度）、交叉熵

机器学习 - 香农信息量，熵，联合熵，条件熵，相对熵，交叉熵，互信息

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)