神经网络中激活函数的总结 - 代码天地

神经网络中激活函数的总结

其他 2019-03-23 00:10:52 阅读次数: 0

激活函数出现的原因

1、遇到线性不可分的数据。神经网络也找不到一条合适的直线。
在这里插入图片描述
2、如何解决

尝试单层感知机。
尝试多层感知机
化简后发现仍然是一个线性分类器。

3、激活函数的作用

在隐藏层和输出层之间加入一个激活函数，sigmoid。
多层感知器

激活函数就是在神经元上加一个壳，为神经元带来非线性因素，提升模型的表达能力。第一步计算线性变化，第二步计算非线性变换。

激活函数大全

1、一致或线性激活函数

最简单的激活函数，输出与输入成比例，导数为常数，所以梯度也将是一个常数，下降时将会是恒定的梯度。
范围：负无穷到正无穷

2、Heaviside（二值型激活函数，0或1，high或low）步长函数

早期单层感知器中使用，对二进制分类任务有用，输入累加和高过某个阈值输出值为1，低于某个阈值输出0.
值域范围0-1

3、Sigmoid或Logistic激活函数（Soft Step）

主要应用在二进制的分类问题，具有梯度消失。

在这里插入图片描述

求导：
缺点：由导数可以看出当Z的值非常大或者非常小的时候，导数接近0，会导致权重W的梯度接近0，也就是梯度更新变慢，最后梯度消失。函数输出的均值并不是0，不便于下一层计算，所以可以作为输出层进行二分类，不适合在隐藏层。
i. 梯度消失的原理
a.

b. 对上图的第一个隐藏层节点进行计算，假设实际值为a，激活值为a[1],则代价函数为

其中a[1]的计算过程一般为两步，第一步线性变换

第二步非线性变换

权重w11的梯度为

c. 可以看出

Z[1]非常大或者非常小的时候，导数都为0，梯度也就为0.
e) 范围（0,1）

4、双曲正切函数（TanH）

扫描二维码关注公众号，回复： 5622988 查看本文章

看起来像一个缩放的S形函数，数据以零为中心。收敛速度更快。、

在这里插入图片描述

求导：
缺点：和sigmoid函数一样当Z很大或者很小时，导数接近于0，梯度消失问题。
但是弥补了均值问题。
范围（-1,1）

5、修正线性单元（ReLU）

比tanh快6倍，当输入值小于零时，输出值为零。输入值大于等于零时，输出值等于输入值。导数为1.
函数：
求导：
优点：输入为正数时，不存在梯度消失的问题。因为是分段线性的原因，所以计算速度是比sigmoid和tanh函数的计算指数要快的。
缺点：当输入为负时，梯度为0，会产生梯度消失的问题。
范围（0，x）

6、Leaky ReLU（PReLU）

在这里插入图片描述

导数：
优点可以避免ReLU的输入为负时的梯度消失问题
范围：负无穷到正无穷 a取值（0,1）

参考文章：
https://www.cnblogs.com/lliuye/p/9486500.html
https://blog.csdn.net/SIGAI_CSDN/article/details/80724034
https://blog.csdn.net/program_developer/article/details/78704224
https://mp.weixin.qq.com/s/4gElB_8AveWuDVjtLw5JUA

猜你喜欢

转载自blog.csdn.net/weixin_40192195/article/details/88209838

神经网络中激活函数的总结

神经网络的激活函数总结

神经网络常用激活函数总结

神经网络激活函数总结

神经网络激活函数的总结

神经网络中的激活函数

浅谈神经网络中的激活函数

神经网络中激活函数的比较

神经网络常见的激活函数,神经网络中的激活函数

神经网络的激活函数

神经网络激活函数

【神经网络】激活函数

机器学习：神经网络激活函数总结

搭建神经网络中常用激活函数总结

通俗理解神经网络中激活函数作用

神经网络中的激活函数的作用和选择

神经网络中激活函数的真正意义？

神经网络中的激活函数sigmoid、 tanh 、RELU

神经网络中的非线性激活函数

[深度学习] 神经网络中的激活函数（Activation function）

尝试理解神经网络中的激活函数

神经网络中的感知机算法和激活函数

神经网络之激活函数

神经网络中常用的激活函数

理解神经网络的激活函数

[深度学习]神经网络的激活函数

20171115-神经网络激活函数

神经网络-常用激活函数

神经网络——激活函数的作用

神经网络----几种基本激活函数

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)