激活函数ReLU为什么比Sigmoid效果好_梯度消失 - 代码天地

激活函数ReLU为什么比Sigmoid效果好_梯度消失

编程语言 2020-01-19 17:00:32 阅读次数: 0

参考:
https://blog.csdn.net/u014114990/article/details/50144653
第一个问题：为什么引入非线性激励函数？
如果不用激励函数（其实相当于激励函数是f(x) = x），在这种情况下你每一层输出都是上层输入的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与只有一个隐藏层效果相当，这种情况就是多层感知机（MLP）了。
正因为上面的原因，我们决定引入非线性函数作为激励函数，这样深层神经网络就有意义了（不再是输入的线性组合，可以逼近任意函数）。最早的想法是sigmoid函数或者tanh函数，输出有界，很容易充当下一层输入（以及一些人的生物解释balabala）。

第二个问题：Relu的优势：
第一，采用sigmoid等函数，反向传播求误差梯度时，求导计算量很大，而Relu求导非常容易。
第二，对于深层网络，sigmoid函数反向传播时，很容易就会出现梯度消失的情况（在sigmoid接近饱和区时，变换太缓慢，导数趋于0），从而无法完成深层网络的训练。
主要是因为它们gradient特性不同。sigmoid和tanh的gradient在饱和区域非常平缓，接近于0，很容易造成梯度消失的问题，减缓收敛速度。

第三，Relu会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生（以及一些人的生物解释balabala）。
在这里插入图片描述

PS:
在矩阵中，若数值为0的元素数目远远多于非0元素的数目，并且非0元素分布没有规律时，则称该矩阵为稀疏矩阵；
与之相反，若非0元素数目占大多数时，则称该矩阵为稠密矩阵

发布了273 篇原创文章 · 获赞 1 · 访问量 4647

私信关注

猜你喜欢

转载自blog.csdn.net/wj1298250240/article/details/104042491

激活函数ReLU为什么比Sigmoid效果好_梯度消失

神经网络激活函数sigmoid relu tanh 为什么sigmoid 容易梯度消失

ReLU为什么比Sigmoid效果好

sigmoid relu激活函数, 为什么使用relu?

深度学习（十六） ReLU为什么比Sigmoid效果好

ReLU为什么比Sigmoid效果好，有何不同？

深度学习中的激活函数Sigmoid和ReLu激活函数和梯度消失问题。

激活函数-Sigmoid, Tanh及ReLU

激活函数 sigmoid、tanh、relu

激活函数 sigmoid，tanh，relu

激活函数：Sigmoid、Softmax、ReLU

激活函数（sigmoid、tanh、ReLU、leaky ReLU）

神经网络中的激活函数具体是什么？为什么ReLu要好过于tanh和sigmoid function?（转）

神经网络中的激活函数具体是什么？为什么Relu要好过与tanh和sigmoid function

激活函数-Sigmoid,Tanh,ReLu,softplus,softmax

深度学习——激活函数Sigmoid/Tanh/ReLU

激活函数Sigmoid、Tanh、ReLu、softplus、softmax

Matlab画激活函数sigmoid， tanh，Relu等

Matlab绘制激活函数sigmoid，Relu

激活函数（Relu，sigmoid，Tanh，softmax）详解

常用的激活函数（Sigmoid、Tanh、ReLU等）

什么是sigmoid激活函数？

PyTorch | 激活函数（Sigmoid、Tanh、ReLU和Leaky ReLU）

Sigmoid激活函数和ReLU激活函数的区别：

深度学习 --- 优化入门三（梯度消失和激活函数ReLU）

激活函数：阶跃函数，sigmoid函数，ReLU函数

为什么神经元的激活函数是sigmoid型？

机器学习之Logistic回归激活函数为什么是Sigmoid？

梯度消失和ReLU

激活函数sigmoid与softmax和relu及其反向传播

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)