《动手学深度学习》笔记 Task06：批量归一化和残差网络；凸优化；梯度下降

其他 2020-03-06 17:25:16 阅读次数: 0

学习地址：https://www.boyuai.com/elites/course/cZu18YmweLv10OeV/jupyter/xfPhM5j9chB59NFhsKkpF

批量归一化和残差网络

批量归一化

概念

对输入的标准化（浅层模型）
处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。
标准化处理输入数据使各个特征的分布相近
批量归一化
利用小批量上的均值和标准差，不断调整神经网络中间输出，从而使整个神经网络在各层的中间输出的数值更稳定。

1.对全连接层做批量归一化

位置：全连接层中的仿射变换和激活函数之间。

2.对卷积层做批量归一化

位置：卷积计算之后、应⽤激活函数之前。
如果卷积计算输出多个通道，我们需要对这些通道的输出分别做批量归一化，且每个通道都拥有独立的拉伸和偏移参数。计算：对单通道，batchsize=m,卷积计算输出=pxq 对该通道中m×p×q个元素同时做批量归一化,使用相同的均值和方差。

3.预测时的批量归一化

训练：以batch为单位,对每个batch计算均值和方差。
预测：用移动平均估算整个训练数据集的样本均值和方差。

残差网络（ResNet）

深度学习的问题：深度CNN网络达到一定深度后再一味地增加层数并不能带来进一步地分类性能提高，反而会招致网络收敛变得更慢，准确率也变得更差。

残差块（Residual Block）

恒等映射：
左边：f(x)=x
右边：f(x)-x=0 （易于捕捉恒等映射的细微波动）
在这里插入图片描述
在残差块中，输⼊可通过跨层的数据线路更快地向前传播。

ResNet模型

卷积(64,7x7,3)
批量一体化
最大池化(3x3,2)

残差块x4 (通过步幅为2的残差块在每个模块之间减小高和宽)

全局平均池化

全连接

扫描二维码关注公众号，回复： 9623180 查看本文章

稠密连接网络（DenseNet）

在这里插入图片描述

主要构建模块

稠密块（dense block）：定义了输入和输出是如何连结的。
过渡层（transition layer）：用来控制通道数，使之不过大。

凸优化

凸优化与深度学习

优化与估计

尽管优化方法可以最小化深度学习中的损失函数值，但本质上优化方法达到的目标与深度学习的目标并不相同。

优化方法目标：训练集损失函数值
深度学习目标：测试集损失函数值（泛化性）

优化在深度学习中的挑战

局部最小值

在这里插入图片描述

鞍点

在这里插入图片描述

梯度消失

凸性（convexity）

基础

在这里插入图片描述

集合

在这里插入图片描述

Jensen不等式\

在这里插入图片描述

性质

无局部最小值

在这里插入图片描述

与凸集的关系

在这里插入图片描述

凸函数与二阶导数

在这里插入图片描述

限制条件

在这里插入图片描述

拉格朗日乘子法

在这里插入图片描述

惩罚项

在这里插入图片描述

投影

在这里插入图片描述

梯度下降

一维梯度下降

在这里插入图片描述
学习率

在这里插入图片描述

多维梯度下降

在这里插入图片描述

自适应方法

牛顿法

在这里插入图片描述

收敛性分析

在这里插入图片描述
预处理（海森矩阵辅助梯度下降）

梯度下降与线性搜索（共轭梯度法）

随机梯度下降

随机梯度下降参数更新

在这里插入图片描述

动态学习率

在这里插入图片描述

小批量随机梯度下降

dujiahei

发布了79 篇原创文章 · 获赞 119 · 访问量 53万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/dujiahei/article/details/104440455

动手学 Task06批量归一化和残差网络+凸优化+梯度下降

《动手学深度学习》task06 批量归一化和残差网络；凸优化；梯度下降笔记

《动手学深度学习》笔记 Task06：批量归一化和残差网络；凸优化；梯度下降

《动手学深度学习》task06 批量归一化和残差网络；凸优化；梯度下降课后作业

动手学深度学习之从批量归一化和残差网络、凸优化、梯度下降

ElitesAI·动手学深度学习PyTorch版学习笔记-批量归一化和残差网络；凸优化；梯度下降

Task06：批量归一化和残差网络；凸优化；梯度下降（1天）

DataWhale组队打卡学习营task06-1 批量归一化和残差网络

《动手学深度学习》Pytorch版学习笔记（三）：Task06

《动手学深度学习》学习笔记（一）

动手学深度学习笔记（一）——机器学习

动手学深度学习PyTorch版-task06

ElitesAI·动手学深度学习PyTorch版笔记（一）

批量归一化和残差网络凸优化和梯度下降

动手学深度学习——批量归一化

动手学深度学习16：批量归一化

批量归一化和残差网络 & 凸优化 & 梯度下降

批量归一化和残差网络；凸优化；梯度下降

批量归一化和残差网络；凸优化；梯度下降

动手学深度学习——残差网络ResNet

批量归一化与残差网络、凸优化、梯度下降法

《动手学深度学习》Pytorch版学习笔记（一）：Task02

《动手学深度学习》Pytorch版学习笔记（一）：Task01

动手学深度学习（九、深度学习优化算法）

梯度下降 -《动手学深度学习pytorch》

《动手学深度学习》task01-02笔记《动手学深度学习》task01-02疑难杂症

《动手学深度学习》Pytorch版学习笔记（二）：Task03

伯禹公益AI《动手学深度学习PyTorch版》Task 02 学习笔记

伯禹公益AI《动手学深度学习PyTorch版》Task 01 学习笔记

《动手学深度学习》Pytorch版学习笔记（二）：Task05

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)