[深度学习]神经网络的激活函数 - 代码天地

[深度学习]神经网络的激活函数

其他 2018-08-05 22:14:26 阅读次数: 0

为什么要引入非线性激活函数

如果不使用非线性激活函数，激活函数本质上相当于f(x)=ax+b。在这种情况下，神经网络每一层的输出都是上层输入的线性函数。此时，不管神经网络有多少层，输出与输入都是线性关系，与没有隐层是一样的。也就相当于最原始的感知机，连最基本的异或问题都无法解决，更别说其他更复杂的非线性问题。

常见的激活函数

sigmoid函数

sigmoid函数的数学形式为，导数为f(x)(1-f(x))。

作为激活函数，其缺点如下：

（1）当输入很大或很小，饱和的神经元会带来梯度消失（Gradient Vanishing)；

（2）函数的输出不是以0为对称的（zero-centered）（解释）；

（3）使用指数函数，计算代价有点高。

tanh函数

tanh函数的数学形式为，导数为1-f(x)^2。

与sigmoid函数相比，其解决了zero-centered的问题。但是，梯度消失与指数函数计算代价高的问题，仍然存在。

relu函数

relu函数的全称是，rectified linear unit（修正线性单元函数），其数学形式为f(x) = max(0,x)。

优点：

（1）在输入空间的一半都不存在饱和问题；

（2）收敛速度快；

缺点：

（1）输出不是以0为中心；

（2）Dead Relu Problem，指的是某些神经元可能永远不会被激活，导致相应的参数永远不会被更新（参数初始化问题或者参数更新太大）；

（3）在输入空间的另一半会存在梯度消失的问题。

其他方法

Leaky Relu : f(x) = max(0.1x, x)

maxout：f(x) = (w1x+b, w2x+b)

elu: f(x) = x, x>=0; f(x) = a(e^x-1), x<= 0

使用

1.最常使用Relu，需要小心地调节学习速率

2.偶尔可考虑Relu的变种，如上面的其他方法中提到的那些

3.一般不使用sigmoid

猜你喜欢

转载自blog.csdn.net/u013250416/article/details/80991831

[深度学习]神经网络的激活函数

神经网络，深度学习，为什么要用激活函数？？？？？

[深度学习] 神经网络中的激活函数（Activation function）

深度学习基础算法-神经网络之激活函数

深度学习：01 神经网络与激活函数

神经网络学习-激活函数

深度神经网络之损失函数和激活函数

吴恩达神经网络与深度学习章节笔记（二）——神经网络和激活函数

【深度学习】——神经网络中常用的激活函数：sigmoid、Relu、Tanh函数

深度神经网络调参之激活函数

【深度学习技术】卷积神经网络常用激活函数总结

深度学习：卷积神经网络，卷积，激活函数，池化

吴恩达深度学习(18)-神经网络激活函数讲解

深度学习系列Day1--神经网络基础，激活函数

深度学习（五）激活函数的选择 & 浅层神经网络的梯度下降

吴恩达神经网络和深度学习笔记（广播，激活函数）

深度学习中，多层神经网络中为何加入激活函数？

深度学习（python）——神经网络(Artificial Neural Networks)激活函数代码

深度学习（二）一文带你了解神经网络，激活函数

神经网络激活函数

神经网络的激活函数

【神经网络】激活函数

机器学习：神经网络激活函数总结

神经网络激活函数学习要点记录

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——激活函数的导数（Derivatives of activation functions）

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——激活函数（Activation functions）

神经网络中常用的激活函数

神经网络之激活函数

神经网络的激活函数总结

神经网络中的激活函数

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)