RELU激活函数作用 - 代码天地

RELU激活函数作用

其他 2018-05-19 10:30:54 阅读次数: 2

梯度消失现象：在某些神经网络中，从后向前看，前面层梯度越来越小，后面的层比前面的层学习速率高。
这里写图片描述
梯度消失原因：

sigmoid函数导数图像

导数最大为0.25<1
权重初始值通常使用一个高斯分布所以|w|<1，所以 wjσ′(zj)<0.25 ,根据链式法则计算梯度越来越小。由于层数的增加，多个项相乘，势必就会导致不稳定的情况。
sigmoid激活函数的缺点：
1.计算量大，反向传播求梯度误差时，求导涉及除法2.反向传播容易出现梯度消失
解决方法：
RELU函数代替sigmoid函数
Alex在2012年提出的一种新的激活函数。该函数的提出很大程度的解决了BP算法在优化深层神经网络时的梯度耗散问题

优点：
∙ x>0 时，梯度恒为1，无梯度耗散问题，收敛快；
∙ 增大了网络的稀疏性。当x<0 时，该层的输出为0，训练完成后为0的神经元越多，稀疏性越大，提取出来的特征就约具有代表性，泛化能力越强。即得到同样的效果，真正起作用的神经元越少，网络的泛化性能越好
∙ 运算量很小,训练时间少；
缺点：
如果后层的某一个梯度特别大，导致W更新以后变得特别大，导致该层的输入<0，输出为0，这时该层就会‘die’，没有更新。当学习率比较大时可能会有40%的神经元都会在训练开始就‘die’，因此需要对学习率进行一个好的设置。
由优缺点可知max(0,x) 函数为一个双刃剑，既可以形成网络的稀疏性，也可能造成有很多永远处于‘die’的神经元，需要tradeoff

猜你喜欢

转载自blog.csdn.net/htt789/article/details/80235908

RELU激活函数作用

ReLU激活函数的缺点

激活函数-ReLU

Relu激活函数

Relu激活函数的优点

ReLU激活函数杂谈

激活函数ReLU

通俗理解激活函数作用和常见激活函数总结：sigmoid、tanh、relu、Leaky-relu、P-relu、R-Relu、elu

relu函数的作用

relu激活函数解读 Tensorflow学习——ReLu

激活函数（sigmoid、tanh、ReLU、leaky ReLU）

【激活函数】ReLU激活函数的思考

relu6激活函数

tensorflow激活函数relu()的详解

激活函数-Sigmoid, Tanh及ReLU

激活函数 sigmoid、tanh、relu

激活函数 sigmoid，tanh，relu

激活函数：Sigmoid、Softmax、ReLU

激活函数(ReLU, Swish, Maxout)

ReLU激活函数（线性整流函数），Python

ReLU激活函数（线性整流函数）

激活函数ReLU、Leaky ReLU、PReLU和RReLU

[转]激活函数ReLU、Leaky ReLU、PReLU和RReLU

sigmoid relu激活函数, 为什么使用relu?

PyTorch | 激活函数（Sigmoid、Tanh、ReLU和Leaky ReLU）

激活函数-Sigmoid,Tanh,ReLu,softplus,softmax

深度学习——激活函数Sigmoid/Tanh/ReLU

激活函数Sigmoid、Tanh、ReLu、softplus、softmax

【机器学习】激活函数(ReLU, Swish, Maxout)

caffe Python API 之激活函数ReLU

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)