神经网络中的非线性激活函数

编程语言 2018-11-25 09:00:41 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/84345922

目录

1. ReLU 整流线性单元

2. 绝对值整流线性单元

3. 渗漏整流线性单元

4. 参数化整流线性单元

5. maxout 单元

6. logistic sigmoid 单元

7. 双曲正切单元

8. 径向基函数

9. softplus 函数

10. 硬双曲正切函数

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔~我会非常开心的~

0. 前言

万能近似定理（universal approximation theorem）表示，一个前馈神经网络如果具有线性输出层和至少一层具有任何一种挤压性质的激活函数的隐藏层，只要给予网络足够数量的隐藏单元，它可以以任意精度来近似任何从一个有限维空间到另一个有限维空间的可测函数，前馈神经网络的导数也可以任意好的近似函数的导数。

假设，在神经网络中不使用非线性激活函数，输入层 $x$ ，隐藏层输出 $z_1$ ，输出层输出 $z_2$ ，最终的输出仍然是线性的。

$z^{(1)}=(w^{(1)})^Tx+b^{(1)}$

$\begin{align*} z^{(2)} &=(w^{(2)})^Tz^{(1)}+b^{(2)} \\ &=(w^{(2)})^T((w^{(1)})^Tx+b^{(1)})+b^{(2)} \\ &=(w^{(2)})^T(w^{(1)})^Tx+(w^{(2)})^Tb^{(1)}+b^{(2)} \\ &= w^Tx+b \end{align*}$

在新技术的研究和开发期间，通常会测试很多不同的激活函数，并且发现许多标准方法的变体表现非常好。

1. ReLU 整流线性单元

大多数隐藏单元采用 ReLU 整流线性单元（rectified linear unit）， $g(z)=\max\{0,z\}$ ：

如上图所示（图源：深度学习），函数仍然非常接近线性，因此它保留了许多线性模型易于使用梯度优化的属性。

ReLU 的一个缺陷是它们不能通过基于梯度的方法学习那些使激活函数为零的样本。

2. 绝对值整流线性单元

绝对值整流线性单元（absolute value rectification）表示为， $g(z)=\left|z\right|$ ：

3. 渗漏整流线性单元

渗漏整流线性单元（Leaky ReLU）表示为， $g(z)=\max(0,z)+0.01\min(0,z)$ ：

4. 参数化整流线性单元

参数化整流线性单元（parametric ReLU，PReLU）表示为， $g(z)=\max(0,z)+\alpha \min(0,z)$ 。

将 $\alpha$ 作为学习的参数。

5. maxout 单元

maxout 单元将输入 $z$ 划分为每组 $k$ 个值的几个组，然后针对每组输出组内最大的值：

$g(z)_i=\max_{j\in \mathbb{G}^{(i)}} z_j$

换言之，输入 $n$ 个特征，在不损失信息的情况下，每一组的 $k$ 个特征用最大值概括，那么输出就能减少 $k$ 倍的特征。

maxout 单元可以学习具有多达 $k$ 段的分段线性凸函数，使用足够大的 $k$ ，maxout 单元可以以任意精度来近似任何凸函数。

6. logistic sigmoid 单元

sigmoid 单元在其大部分区域内都饱和，使得基于梯度的学习变得非常困难，所以不鼓励其作为隐藏单元激活函数：

$\sigma(z)=\frac{1}{1+e^{-z}}$

${\sigma(z)}'=\sigma(z)(1-\sigma(z))$

7. 双曲正切单元

双曲正切函数定义为：

$g(z)=\textup{tanh}(z)=2\sigma(2z)-1$ ：

${g(z)}'=1-g(z)^2$

8. 径向基函数

径向基函数（radial basis function，RBF）表示为：

$h_i=\exp(-\frac{\left\|W_{:,i}-x\right\|^2}{\sigma_i^2})$

这个函数只有在 $x$ 很接近模版时才有用，大部分时候都饱和，因此很难优化。

9. softplus 函数

softplus 函数是 ReLU 的平滑版本：

$g(z)=\zeta (z)=\log(1+e^z)$

10. 硬双曲正切函数

硬双曲正切函数（hard tanh）与双曲正切函数和 ReLU 类似：

$g(z)=\max(-1,\min(1,z))$

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔~我会非常开心的~

猜你喜欢

转载自blog.csdn.net/zhq9695/article/details/84345922

神经网络中的非线性激活函数

神经网络为什么需要非线性激活函数

神经网络中为什么引入非线性激活函数？

卷积神经网络——非线性激活

神经网络-非线性激活

tensorflow神经网络拟合非线性函数

BP神经网络非线性函数拟合

【MATLAB】用简单神经网络逼近非线性函数

浅层神经网络/深层神经网络的前向传播与反向传播计算过程、非线性的激活函数(Sigmoid、Tanh、Relu、Leaky ReLU)、参数与超参数

MATLAB神经网络（2） BP神经网络的非线性系统建模——非线性函数拟合

非线性方程组求解方法,神经网络的非线性函数

【阅读笔记】神经网络中的LRP及其在非线性神经网络中的运用

神经网络中的激活函数

神经网络中激活函数的总结

浅谈神经网络中的激活函数

神经网络中激活函数的比较

什么是神经网络的非线性

求解时变复值西尔维斯特方程的非线性激活神经网络总结

pytorch初学笔记（十一）：神经网络基本结构之非线性激活层的使用

神经网络常见的激活函数,神经网络中的激活函数

神经网络求解线性方程组,人工神经网络激活函数

使用以sigmoid()作为激活函数的含隐藏层神经网络演示非线性二分类器原理

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——为什么需要非线性激活函数？（why need a nonlinear activation function?）

神经网络激活函数

神经网络的激活函数

【神经网络】激活函数

MATLAB神经网络（7） RBF网络的回归——非线性函数回归的实现

非线性激活函数

《MATLAB 神经网络43个案例分析》：第2章 BP神经网络的非线性系统建模——非线性函数拟合

MATLAB神经网络（3）遗传算法优化BP神经网络——非线性函数拟合

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)