深度学习手记（三）之激活函数 - 代码天地

深度学习手记（三）之激活函数

其他 2018-06-18 20:12:41 阅读次数: 2

激活函数在神经网络模型中是非常重要的一步。如果没有激活函数，那么不管神经网络有多少层，整个网络都是线性的，从而没有办法解决复杂的分类问题。
那么激活函数有哪些呢？
在维基百科上可以查到：https://en.wikipedia.org/wiki/Activation_function
在这里介绍几个比较常用的激活函数：
relu：
这里写图片描述
根据公式，我们可以用python代码简单实现：

def relu(inputs):
    y = [x * (x > 0) for x in inputs]
    return y

Relu函数的优点在于使用随机梯度下降优化器时，收敛的速度更快一点，但是，同时他对学习率的要求更高，如果学习率大了，就会导致一些的神经元不起作用。

tanh（双切正切函数）：
这里写图片描述
根据公式，我们可以用python代码简单实现：

def tanh(inputs):
    y = [(np.exp(x) - np.exp(-x)) / float(np.exp(x) + np.exp(-x)) for x in inputs]
    return y

tanh在特征差异比较明显时得效果要好一点，因为，它的取值在[-1, 1]可以理解越往两端走，越容易分别类型。

sigmoid：
这里写图片描述
根据公式，我们可以用python代码简单实现：

def sigmoid(inputs):
    y = [1 / float(1 + np.exp(-x)) for x in inputs]
    return y

sigmoid函数对二分类问题比较实用，但是当特征复杂时，效果就不如tanh函数了。

softplus：
这里写图片描述
根据公式，我们可以用python代码简单实现：

def softplus(inputs):
    y = [np.log(1 + np.exp(x)) for x in inputs]
    return y

softplus是有效的梯度传播函数，没有梯度消失无法完成深度网络的训练的情况。
具体它的具体优势或问题，可以参考：
https://en.wikipedia.org/wiki/Rectifier_(neural_networks)

下面用python将这几种激活函数可视化表示出来：
这里写图片描述

猜你喜欢

转载自blog.csdn.net/llh_1178/article/details/79652613

深度学习手记（三）之激活函数

深度学习手记（五）之优化方法

深度学习手记（四）之线性模型

深度学习手记（二）之占位符Placeholder

深度学习之激活函数（三）

深度学习手记（五）之LeNet-5预测模型

学习高手的三驾马车（手记）

[TensorFlow]学习手记 4 - 激励函数

GeoServer学习手记（三）：GeoServer架构浅谈

GlusterFS学习手记

Webpack 学习手记

Python学习手记

Ansible学习手记

pytest学习手记

前端学习随手记之正则及表单验证

深度学习（二）：深度学习与神经网络学习笔记（手记）

深度学习之激活函数分析

深度学习（二）之激活函数

tensorflow中的函数随手记

Android开发之SpannableStringBuilder手记

WebRTC手记之框架与接口

[深度学习] 激活函数

深度学习 - 激活函数

深度学习----激活函数

【深度学习】激活函数

深度学习：激活函数

深度学习-激活函数

深度学习手记（六）之实现稀疏自编码算法（SAE）的优化过程

Fortran 学习手记——数组篇

Extjs学习手记(1)

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)