深度学习（六）：多层感知机

其他 2020-05-03 19:59:06 阅读次数: 0

文章目录

引入

1.1 隐藏层

引入

深度学习主要关注多层模型，接下来将以多层感知机 (multi-layer perceptron, MLP)为例，介绍多层神经网络的概念。

1.1 隐藏层

多层感知机在单层神经网络的基础上引入了一到多个隐藏层 (hidden layer)。隐藏层位于输入层和输出层之间，以下图为例，它含有一个隐藏层，该层包含5个隐藏单元 (hidden unit)：
在这里插入图片描述
图片来源：李沐、Aston Zhang等老师的这本《动手学深度学习》一书。
由于输入层不涉及计算，所以上图所示的感知机的层数为2。
相关的符号如下：

符号	含义
$\boldsymbol{X} \in \boldsymbol{R}^{n×d}$	小批量样本
$n$	批量大小
$d$	输入个数
$h$	隐藏单元个数 (假设只有一个隐藏层)
$\boldsymbol{H} \in \boldsymbol{R}^{n × h}$	隐藏层的输出
$\boldsymbol{W}_h \in \boldsymbol{R}^{d × h}$	隐藏层权重参数
$\boldsymbol{b}_h \in \boldsymbol{R}^{1 × h}$	隐藏层偏差参数
$\boldsymbol{W}_o \in \boldsymbol{R}^{h × q}$	输出层权重参数
$\boldsymbol{b}_0 \in \boldsymbol{R}^{1 × q}$	输出层偏差参数
$q$	输出个数

首先介绍一种含单隐藏层的多层感知机的设计，其输出 $\boldsymbol{O} \in \boldsymbol{R}^{n × q}$ 的计算为：
$\begin{matrix} \boldsymbol{H} = \boldsymbol{XW}_h + \boldsymbol{b}_h\\ \boldsymbol{O} = \boldsymbol{XW}_o + \boldsymbol{b}_o \tag{1} \end{matrix}$ 也就是将隐藏层的输出直接作为输出层的输入。联立上式：
$\boldsymbol{O} = \boldsymbol{XW}_h \boldsymbol{Wo} + \boldsymbol{b}_h \boldsymbol{W}_o + \boldsymbol{b}_o \tag{2}$ 从联立的式子可以看出，虽然神经网络引入了隐藏层，却依然等价于一个单层神经网络。显然，即便引入再多的隐藏层，以上设计依然只能与仅含输出层的单层神经网络等价。

因吉

原创文章 35 获赞 44 访问量 8627

关注私信

猜你喜欢

转载自blog.csdn.net/weixin_44575152/article/details/104742757

深度学习（六）：多层感知机

深度学习之多层感知机学习

动手学深度学习笔记（六）——多层感知机及实现

多层感知机的学习

MXNet动手学深度学习笔记：多层感知机

动手学深度学习(二)——多层感知机(gluon)

深度学习第三课多层感知机

动手学深度学习三---多层感知机MLP

动手学深度学习-多层感知机

深度学习-多层感知机的从零开始实现

动手学深度学习——多层感知机

深度学习系列（一）多层感知机 2020.6.15

【深度学习】实验2答案：构建自己的多层感知机

动手学深度学习PyTorch（四）：多层感知机

《动手学深度学习》（3）多层感知机

【深度学习】实验2布置：构建自己的多层感知机

《动手实现深度学习》笔记（三）多层感知机

《动手学深度学习》——多层感知机

【动手学深度学习】李沐——多层感知机

深度学习——感知机：多层感知机（multi-layered perceptron）图文详解

动手学深度学习（三、深度学习基础--多层感知机、基础知识）

深度学习__感知机

深度学习——感知机

动手学习深度学习2-1多层感知机

动手学深度学习学习笔记tf2.0版（3.8: 多层感知机）

HelloDNN，多层感知机MLP学习笔记

机器学习：多层感知机原理及实现

学习笔记 | 多层感知机（MLP）、Transformer

多层感知机学习XOR实例

【实用机器学习】3.5 多层感知机

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)