动手学深度学习——多层感知机 - 代码天地

动手学深度学习——多层感知机

其他 2020-04-21 13:39:17 阅读次数: 0

多层感知机

多层感知机是一种简单的神经网络，包含输入层、隐藏层以及输出层。如下图所示。
在这里插入图片描述

多层感知机的计算过程

输入层为小批量样本 $\boldsymbol{X} \in \mathbb{R}^{n \times d}$ ，批量大小为 $n$ ，输入个数为 $d$ 。上述图的多层感知机为单隐藏层，隐藏层输出为 $H$ ， $\boldsymbol{H} \in \mathbb{R}^{n \times h}$ ， $h$ 为隐藏层单元个数。网络各层之间全连接，设隐藏层的权重参数和偏差参数分别为 $\boldsymbol{W}_{h} \in \mathbb{R}^{d \times h}$ ， $\boldsymbol{b}_{h} \in \mathbb{R}^{1 \times h}$ 。输出层的权重和偏差参数分别为 $\boldsymbol{W}_{o} \in \mathbb{R}^{h \times q}$ ， $\boldsymbol{b}_{o} \in \mathbb{R}^{1 \times h}$ 。
多层感知机的输出为：
$\boldsymbol{O}=(\boldsymbol{X}\boldsymbol{W}_{h}+\boldsymbol{b}_{h})\boldsymbol{W}_{o}+\boldsymbol{b}_{o}$

激活函数

神经网络的最大特点之一是能够拟合数据之间的非线性关系，其关键在于激活函数的使用。激活函数主要包括ReLU函数，Sigmoid函数，tanh函数。
（1）ReLU函数
$\\ReLU(x) = max(x,0)$
ReLU函数只保留正数元素，并将负数元素清零。其函数图像为：在这里插入图片描述
ReLU函数求导：

（2）Sigmoid函数
Sigmoid函数可以将元素的值变换到0和1之间。
$\\sigmoid(x) = 1/(1+exp(-x))$

sigmoid函数求导：

（3）tanh函数
tanh函数是将元素值变换到-1和1之间：
$\\tanh(x) = (1-exp(-2x))/(1+exp(-2x))$
在这里插入图片描述
tanh函数求导：

（4）三种激活函数的选择

用于分类器时，sigmoid函数及其组合通常效果更好。由于梯度消失问题，有时要避免使用sigmoid和tanh函数。
在神经网络层数较多的时候，最好使用ReLu函数，ReLu函数比较简单计算量少，而sigmoid和tanh函数计算量大很多。
在选择激活函数的时候可以先选用ReLu函数如果效果不理想可以尝试其他激活函数。

注：以上资源来源于伯禹平台《动手学深度学习》的学习笔记

伸腿瞪眼丸

发布了19 篇原创文章 · 获赞 17 · 访问量 1466

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43839651/article/details/104316663

MXNet动手学深度学习笔记：多层感知机

动手学深度学习(二)——多层感知机(gluon)

动手学深度学习三---多层感知机MLP

动手学深度学习-多层感知机

动手学深度学习——多层感知机

《动手学深度学习》（3）多层感知机

动手学深度学习PyTorch（四）：多层感知机

《动手学深度学习》——多层感知机

【动手学深度学习】李沐——多层感知机

动手学深度学习（三、深度学习基础--多层感知机、基础知识）

动手学深度学习学习笔记tf2.0版（3.8: 多层感知机）

MXNet动手学深度学习笔记：Gluon实现多层感知机

动手学深度学习(二)——多层感知机(从零开始)

《动手学深度学习》系列笔记—— 1.3 多层感知机

动手学深度学习(PyTorch实现)(五)--多层感知机

【动手学深度学习】---0x04：多层感知机

动手学深度学习4.3 多层感知机的简洁实现

多层感知机 + 代码实现 - 动手学深度学习v2 pytorch

动手学深度学习笔记（六）——多层感知机及实现

【动手学深度学习Pycharm实现5】多层感知机的简单实现

【Datawhale动手学深度学习笔记】多层感知机代码实践

【AI】《动手学-深度学习-PyTorch版》笔记（十四）：多层感知机

《动手实现深度学习》笔记（三）多层感知机

ElitesAI·动手学深度学习PyTorch版学习笔记-线性回归；Softmax与分类模型、多层感知机

《动手学深度学习+PyTorch》3.9多层感知机（MLP）从零开始实现学习笔记

动手学深度学习PyTorch版--Task1--线性回归；Softmax与分类模型、多层感知机

《动手学深度学习》笔记 Task01 线性回归；Softmax与分类模型、多层感知机

动手学习深度学习2-1多层感知机

第3章(3.8～3.10节)多层感知机实现【深度学习基础】--动手学深度学习【Tensorflow2.0版本】

动手深度学习10- pytorch多层感知机从零实现

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)