《图解深度学习》第二章笔记（小小白自用） - 代码天地

《图解深度学习》第二章笔记（小小白自用）

移动开发 2023-05-04 23:21:02 阅读次数: 0

2.2 M-P模型

M-P模型是多个输入对应一个输出的模型，可以实现简单的运算符的逻辑计算，结构如下图所示：
在这里插入图片描述

该模型的缺点在于参数需认为确定。

2.3 感知器

感知器的优点在于可以自动确定参数通过训练。

参数的获得是通过调整实际输出和期望输出之差的方式来获得，这叫做误差修正学习。用公式表示：
在这里插入图片描述

感知器的缺点在于只能解决线性可分问题，不能解决线性不可分的问题。

2.4 多层感知器

为了解决线性不可分问题，于是有了多层感知器。多层感知器的结构如下：
在这里插入图片描述

多层感知器通过误差修正学习来确定两层之间的连接权重，但不能跨层调整，因此早期的多层感知器只能对中间层和输出层之间的权重进行修正学习，对于输入层和中间层只能用随机数当权重。这种情况带来的问题在于可能会出现输入不同的输入值但是可以得到相同的输出值，这将无法准确分类。
那么多层感知器应该如何训练连接权重呢？后来人类提出了误差反向传播。

2.5 误差反向传播算法

误差反向传播算法就是通过比较实际输出和期望输出得到误差信号，把误差信号从输出层逐层向前传播得到各层的误差信号，再通过调整各层的连接权重以减小误差。调整的方式是叫做梯度下降算法。
在这里插入图片描述
只有一个输出单元的多层感知器权重调整过程如下：

参数调整：
在这里插入图片描述
有多个输出单元的多层感知器权重调整过程如下：

参数调整：

单个输出和多个输出的区别在于输入层和中间层之间的权重调整值是相关单元在中间层与输出层之间的权重调整值得总和。

但是激活函数求导后得到得函数值可能会是0，这种情况就会造成梯度消失导致无法调整权重。对于这个问题，需要在训练过程中调整学习率来防止梯度消失。

当层数较多时有可能产生梯度消失和梯度爆炸得情况。

2.6 误差函数和激活函数

一般情况下，误差函数（损失函数）

多分类用交叉熵代价函数：
在这里插入图片描述

二分类用：
在这里插入图片描述

递归问题中用最小二乘误差函数：
在这里插入图片描述

一般情况下激活函数有：

sigmod函数、tanhh函数、ReLU函数等。

2.7 似然函数

似然函数最常见得就是softmax函数。该函数可以解决以下两个问题：一是由于输出层的输出值的范围不确定，我们难以直观上判断这些值的意义。二是，由于真实标签是离散值，这些离散值与不确定范围的输出值之间的误差难以衡量。

2.8 随机梯度下降法

误差反向传播算法有多种，首先是第一种批量学习算法：每次迭代会遍历全部训练样本，该算法能有效一直训练集内噪声，但是训练时间较长。

第二种是在线学习算法，该算法会逐个输入训练样本。因此可能会导致迭代结果出现大幅变动，以至于训练无法收敛。

第三种是小批量随机梯度下降算法，该算法将训练集分成几个子集，每次迭代使用一个子集。全部子集迭代完成后，再次从第一个子集开始迭代调整权重。该方法每次迭代只使用少量样本，相比于批量学习来说能缩短单词训练时间。每次迭代也是使用多个训练样本，相比于在在线学习来说能够减少迭代结果得变动。

2.9 学习率

学习率是用来调整权重连接调整程度的系数。学习率越大步子越大，减少收敛额的时间，但是过大可能会导致无法收敛。而过小可能会收敛很慢。

此外还有一些自适应调整学习率。

猜你喜欢

转载自blog.csdn.net/qq_49785839/article/details/115434133

《图解深度学习》第二章笔记（小小白自用）

《图解HTTP》第二章学习笔记

《图解深度学习》第三章笔记（小白比自用）

Ng深度学习课程-第二章笔记摘要

第二章_小小心得

【深度学习】第二章：数据

小小白学C成长记（第二期）

小小白

《算法图解》第二章笔记与课后练习

[笔记]《算法图解》第二章选择排序

《图解HTTP》读书笔记——第二章

算法图解第二章笔记与习题（选择排序）

图解HTTP读书笔记.第二章

《图解HTTP》学习总结----第二章

Linux学习笔记第二章

[驱动]第二章学习笔记

SICP 第二章学习笔记

Perl学习笔记（第二章）

第二章学习笔记

小小白到小白

小白读《锋利的jQuery(第2版)》第二章学习笔记

《图解HTTP》---第二章（二）

MongoDB 小白学习（第二章）基本操作

深度学习花书学习笔记第二章线性代数

李沐《动手学深度学习》第二章学习笔记(pytorch)

《图解 HTTP 》阅读 —— 第二章

《图解HTTP》————第二章

图解TCPIP---第二章

图解HTTP---第二章

吴恩达深度学习笔记第二章作业1

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)