神经网络之softmax(作用，工作原理【示例说明】，损失计算) - 代码天地

神经网络之softmax(作用，工作原理【示例说明】，损失计算)

企业开发 2023-05-17 06:08:14 阅读次数: 0

1、softmax作用

softmax将输出的分类结果映射到（0-1）之间，将神经网络的分类结果转化成对应的概率。不同的概率，表示此样本属于对应类别的可能性大小，概率越大，样本属于该分类的可能性越大。概率的总和为1。

2、softmax工作原理

softmax位于网络输出层的后边，其在网络结构中的位置如下图所示：

和隐藏层神经元计算类似，softmax层对输出数据先进行线性运算，再使用softmax激活函数将输出转化为概率。

假设softmax的前一层输出用 $a^{[l-1]}$ 表示，则softmax首先进行线性运算：

$z^{[l]}=w^{[l]}a^{[l-1]}+b^{[l]}$ 。

线性运算结束后进行softmax激活函数计算，激活函数公式为：

$a^{[l]} =\frac{e^{z^{[l]}}}{\sum_{j=1}^{n}e^{z_{j}^{[l]}}}$

示例说明：

为了更好地理解softmax激活函数作用，假设在一个分类任务中，softmax前一层输出经线性运算后的结果是[5, 2, -1, 3]，即 $z^{[l]}=[5, 2, -1, 3]$ 。

采用softmax激活函数将输出转化为概率值。其中

扫描二维码关注公众号，回复： 15105713 查看本文章

$a{_{1}}^{[l]}=\frac{e^{5}}{e^{5}+e^{2}+e^{-1}+e^{3}}\approx 0.842$

$a{_{2}}^{[l]}=\frac{e^{2}}{e^{5}+e^{2}+e^{-1}+e^{3}}\approx 0.042$

$a{_{3}}^{[l]}=\frac{e^{-1}}{e^{5}+e^{2}+e^{-1}+e^{3}}\approx 0.002$

$a{_{4}}^{[l]}=\frac{e^{3}}{e^{5}+e^{2}+e^{-1}+e^{3}}\approx 0.114$

根据softmax公式分别算出每一类的概率，得到最终的概率输出为 $a^{[l]}=[0.841, 0.042, 0.002, 0.114]$

3、损失计算

假设分类任务的真实结果是 $y=[0,1,0,0]$ ，经过softmax预测结果是 $\hat{y}=[0.3, 0.2, 0.1, 0.4]$ ，根据如下损失计算公式：

$L(\hat{y},y)=-\sum_{j=1}^{n}y_{j} log\hat{y}_{j}$

在假设的例子中,n=4，则 $L(\hat{y},y)=-(0\times log0.3+1\times log0.2+0\times log0.1+0\times log0.4)$

假设有m个样本,损失为：

$J(w^{[1]},b^{[1]},...)=\frac{1}{m}\sum_{i=1}^{m}L(\hat{y}^{(i)},y^{(i)})$

猜你喜欢

转载自blog.csdn.net/m0_45267220/article/details/129399964

神经网络之softmax(作用，工作原理【示例说明】，损失计算)

softmax交叉熵作为损失函数在神经网络中的作用与求导

【Tensorflow与深度学习笔记day07】5.2. ANN网络分析+Mnist手写数字识别+one-hot编码+SoftMax回归+损失计算-交叉熵损失+实现神经网络模型+模型正确率评估

机器学习 - 损失计算-softmax_cross_entropy_with_logits

卷积神经网络之SoftMax函数

神经网络算法是什么意思,神经网络计算工作原理

卷积神经网络之卷积计算、作用与思想

yolov5目标检测神经网络——损失函数计算原理

交叉熵作为损失函数在神经网络中的作用

深度学习（13）神经网络中损失函数的作用

计算机视觉之卷积神经网络原理

对于分类问题的神经网络最后一层的函数：sigmoid、softmax与损失函数

神经网络的基本工作原理

神经网络的损失函数

神经网络——损失函数

神经网络-损失函数

神经网络-损失函数：

简单粗暴理解与实现机器学习之神经网络NN（二）：神经网络多分类原理与反向传播原理、神经网络计算输出、softmax回归、梯度下降算法、向量化编程、激活函数的选择等等

softmax、softmax loss、cross entropy 卷积神经网络系列之softmax，softmax loss和cross entropy的讲解

深度神经网络之损失函数和激活函数

深层神经网络之经典损失函数

深度神经网络调参之损失函数

卷积神经网络基本计算原理

卷积神经网络系列之softmax，softmax loss和cross entropy的讲解

卷积神经网络系列之softmax，softmax loss和cross entropy

卷积神经网络系列之softmax，softmax loss和cross entropy讲解

卷积神经网络系列之softmax，softmax loss和cross entropy的讲解(精华)

卷积神经网络系列之softmax，softmax loss和cross entropy loss的讲解

多分类交叉熵损失计算

SSD系列3——损失计算

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)