交叉熵与softmax的初步了解 - 代码天地

交叉熵与softmax的初步了解

其他 2018-09-24 11:51:26 阅读次数: 0

前言：

在调试tensorflow官方教程代码时，我发现了交叉熵（Cross Entropy）损失和其之前所用的softmax函数。我还没在《神经网络与机器学习第3版》中看到交叉熵，就大概先了解一下，并且记录下我目前了解到的信息。

正文：

先说交叉熵的公式：

如果是在训练神经网络的情况下，p(i)代表标签中当前样本属于i类的概率。在mnist的标签中此项非1即0，而且只有某一类对应的概率是1，其他都是0。例如当标签为L=[0,0,1,0,0,0,0,0,0,0]时，只有p(2)=1，即p(i)=L[i]。q(i)代表预测结果中当前样本属于i类的概率。

但是预测结果却不能被直接当作各类对应的概率，例如预测结果R=[22.5, 2.44, -2.1, 2.444, 5.6, 62.3, 4.444, -5.565, 6.454, -5.414]。这时就要用softmax函数，其公式如下：

其中i=R[i]。此公式把R转换成了R’，R’如下：

其总合应为1，第6项为1应该是其小数位太多的原因。

之后根据交叉熵的公式算出R对L的损失loss=64.4。

结语：

为什么要用softmax而不是计算简单的线性方法呢？例如线性转换方法：

其中Q(i)为R[i]，Qmin为Q中最小的值，n为Q的个数，O(i)为转换后的结果。

相比于这种线性转换的方法，softmax函数的转换结果中各类的概率之间的差别要大很多，基本达到类似标签的“一类独大”的效果，这也有利于后续计算等（参考：https://www.zhihu.com/question/40403377?sort=created）。

关于交叉熵的意义，参考：https://www.zhihu.com/question/41252833。

猜你喜欢

转载自blog.csdn.net/fish_like_apple/article/details/79666107

交叉熵与softmax的初步了解

交叉熵与softmax

Softmax函数与交叉熵

交叉熵与softmax函数

softmax+交叉熵

SoftMax与交叉熵损失

softmax、交叉熵

tensorflow 交叉熵 softmax分类

softmax和交叉熵。上

Softmax函数交叉熵及其求导

softmax交叉熵损失函数及其求导

tensoflow随笔——softmax和交叉熵

softmax函数和交叉熵总结

softmax函数和交叉熵损失函数

交叉熵和 softmax 公式及 python 实现

PyTorch的SoftMax交叉熵损失和梯度

softmax交叉熵损失函数求导

softmax交叉熵的局限性

交叉熵损失函数（softmax分类器）

softmax交叉熵损失函数的深度理解

PyTorch----Softmax函数与交叉熵函数

从熵、相对熵、交叉熵到机器学习的交叉熵损失与softmax损失函数

面试准备---- 交叉熵，相对熵（KL散度），softmax

大概了解交叉熵

Sigmoid，Softmax，Softmax loss，交叉熵(Cross entropy)，相对熵(relative entropy，KL散度)梳理

交叉熵以及通过Python实现softmax_交叉熵（tensorflow验证）

简单易懂的softmax交叉熵损失函数求导

Softmax交叉熵损失函数反向传播公式推导

BP算法推导-softmax层+交叉熵(logloss)

Softmax和交叉熵的深度解析和Python实现

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)