通俗易懂的Softmax

其他 2020-02-22 09:52:45 阅读次数: 0

作为有年头的炼丹师，现在来写softmax讲解多少还是有点羞耻的。不过有炼丹经验以后，看初级的算法可以有更清晰的见解。

我们带着2个问题看文章：

1. 什么是softmax

2. 为什么用softmax

Softmax

softmax往往加在神经网络的输出层，用于加工神经网络的输出结果：把微弱程度不同的信号整理成概率值，这便是机器学习模型对分类任务的置信度confidence。

图片来自：https://www.cnblogs.com/zongfa/p/8971213.html

用一句话来描述上图：softmax对神经元的输出信号进行加工，输出为分类的概率值。

举个二分类的例子，机器需要分类A和B。那么，机器的输出只可能是A或B，不可能到C。最后两个神经元的输出为(0.1, 0.1)和(100, 100)没有区别，因为机器对这两种分类的confidence依然是各50%。这样，无论神经元最后输出的结果是什么，它都是可以进行置信度量化的。

通过上图，应该可以完全理解softmax是怎么操作的。

为什么使用softmax

softmax有2个无法抗拒的优势：1. softmax作为输出层，结果可以直接反映概率值，并且避免了负数和分母为0的尴尬；

扫描二维码关注公众号，回复： 9321450 查看本文章

2. softmax求导的计算开销非常小，简直就是送的。

对于第1个优势，用负数和0代入公式就可以发现，输出总是(0,1)之间的有理数。

对于第2个优势，我们动笔算一算。先看Softmax的基本公式：

$softmax(x)=\frac{e^{x_a}}{\sum e^{x_i}}$ 式(1)

看着费劲的话，我用三分类情况下的softmax简化一下：

$softmax(x_0)=\frac{e^{x_0}}{e^{x_0}+e^{x_1}+e^{x_2}}$ 式(2)

x0,x1,x2分别是输出层神经元输出的信号，式(2)是x0的softmax函数值。神经网络反向传播的过程中，对x0求偏导，可以把其他看作常数等价于：

$[softmax(x_0)]'=[\frac{e^{x_0}}{e^{x_0}+C}]'$ 式(3)

用大学的知识，很容易求出式(3)的结果，推导如下：

每次计算softmax偏导值，只需做一个减法和一个乘法。在梯度反传过程中，给链式法则中的“那条链”造成的负担特别低。

这也就是softmax为何如此popular的原因了。

木盏博客专家

发布了147 篇原创文章 · 获赞 1858 · 访问量 90万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/leviopku/article/details/101542568

通俗易懂的Softmax

通俗易懂的讲解Softmax

Softmax分类器及交叉熵损失（通俗易懂）

jsonp(对，通俗易懂)

通俗易懂的EM

通俗易懂TensorFlow！

docker：通俗易懂

通俗易懂的Redis

MQ(通俗易懂)

通俗易懂RSA

通俗易懂DenseNet

jsonp，通俗易懂

通俗易懂的TextCNN

通俗易懂的LSTM

通俗易懂的RNN

通俗易懂的LLM

通俗易懂理解ERP

通俗易懂理解ITIL

白话CMMI，^_^，通俗易懂

通俗易懂物联网

MyBatis缓存通俗易懂

快速排序（通俗易懂）

通俗易懂的CRC校验

websocket 简介（通俗易懂）

ajax的封装通俗易懂

通俗易懂的NIO讲解

HDFS的总结---通俗易懂

通俗易懂理解卷积

反向传播——通俗易懂

通俗易懂的设计模式

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)