深度学习理论基础11-输出层的设计 - 代码天地

深度学习理论基础11-输出层的设计

编程语言 2019-01-01 09:10:50 阅读次数: 0

首先，继续上节的话题。softmax()函数。

这只就是softmax函数了。其中a代表输出层的输入数据，ak代表第k个输入。

如果你觉得又难理解又难记，其实可以拆成3步来理解：

1.把所有的输入计算成序列[e**(a1),e**(a2),e**(a3)...e**(an)],用np的广播功能一行就能搞定

2.计算得到上面的结果之和sum

3.第k个输入的softmax之值即为 e**(ak)/sum

是不是用Python语言比数学语言好理解多了？下面是Python实现，感受下。

def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

但是这个函数还有一个瑕疵，如果np.exp方法的参数过大，会出现很大很大很大的数，

毕竟指数爆炸不是闹着玩的。

所以下面是改进版本

def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a - c) # 溢出对策
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

括号里减掉一个c难道不影响结果吗？不要着急懵，非数学精英请跟随我的证明。

如果理解依然有困难。可以这么想，e**(a+c)=e**a乘以e**c

既然分子和分母同时乘以e**c了，它们有什么理由不相同呢?

所以，括号里的部分，只要分子和分母加的是同一个东西，就不影响结果。

softmax()的结果在0~1之间。所以把softmax()的输出称为概率。

softmax()是单调递增的:

也就是说如果输入数据本来就是最大的，经过softmax()计算之后还是最大。

如果输入数据本来排行老二，经过softmax()计算之后还是排行老二。

所以神经网络在'推理'的过程可以省略softmax()。

'推理'是指用学到的模型对未知的数据进行分类，

也称为神经网络的前向传播(forward propagation)。

在输出层使用softmax函数是因为它和神经网络的学习有关系，这部分的内容在后面博文里。

--------结语--------

下集预告：手写数字识别。

猜你喜欢

转载自blog.csdn.net/qq_40878431/article/details/85519761

深度学习理论基础11-输出层的设计

深度学习理论基础

深度学习理论基础8-激活函数

深度学习理论基础1-Numpy

深度学习理论基础9-多维数组

收藏 | 深度学习理论基础讲座

深度学习理论基础10-实现一个3层神经网络

量子机器学习理论基础

《机器学习理论基础》

深度学习入门基础 ----- Python快速教程、深度学习理论基础、Tensorflow基础

深度学习理论基础7-初识神经网络

深度学习理论基础5-感知机的局限性

深度学习理论基础4-简单逻辑电路的感知机实现

深度学习理论基础3-什么是感知机？

深度学习理论基础6-多层感知机

sklearn 学习笔记-3 机器学习理论基础

机器学习理论基础学习5--- PCA

推荐系统-机器学习理论基础详解01

深度学习理论

机器学习综述——机器学习理论基础与发展脉络

机器学习理论基础学习3.3--- Linear classification 线性分类之logistic regression

机器学习理论基础学习8--- 概率图模型

机器学习理论基础学习14.2---线性动态系统-粒子滤波 particle filter

机器学习理论基础学习18---高斯过程回归(GPR)

机器学习理论基础学习16---高斯网络(GN)

机器学习理论基础学习10--- 高斯混合模型GMM

机器学习理论基础学习9--- EM 算法

机器学习理论基础学习7---指数族分布

机器学习理论基础学习15---条件随机场(CRF)

深度学习理论——Softmax

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)