深度学习《CNN架构续篇 - BatchNorm》 - 代码天地

深度学习《CNN架构续篇 - BatchNorm》

其他 2020-10-25 08:41:40 阅读次数: 0

一：batch Normalization
BN算法的灵感来自于对图像的白化操作，白化就是对输入图像数据分原始分布规律转换到N（0~1）的分布，这样会使得收敛速度变快。
在深度网络中每一隐藏层的输入都可以做这样的白化处理呢？
随着网络深度的增加，收敛变慢的的原因还有就是数据的分布会变得越来越畸形，数据分布法还是能移动，这也是会导致梯度消失的原因，因此在每个隐藏层如果都做一个Normalization 的操作，那么就会消除数据不同特征之间的分布的特征范围差异，减少梯度消失的可能性。
算法一共有四个步骤，包括计算均值，计算方差，进行标准化，进行线性变化（使得网络性能维持）。
简单说来，BN的目的是稳定每一层的输入分布，减少数据偏移。
在这里插入图片描述

截图来自BN的论文。这个计算过程也容易理解，其实前三两步骤也就是概率论中学到的参数估计，估计数据的均值与方差，第三步骤是对数据进行转到标准正态分布N~(0,1)，第四步是标准化后的数据进行线性映射。

二：注意的点
BN通常作用于mini-batch中，另外运用BN后，会给每一层隐藏网络增加了γ和β，这俩参数也是需要梯度下降等算法进行学习的。

于是我们需要更新的参数从之前的θ拓展了，增加了连个参数，但是学习过程和更新过程都是和θ的过程一毛一样的。如下所示：
在这里插入图片描述

需要说明的是，这个是标准的梯度下降的算法，其实式子一样还可以变形，之前我们学习了梯度下降的优化，我们一般选择mini-batch的方式，而且在更新数据的时候，实际计算中我们还可以选择动量梯度下降或者RMSprop或者Adam的计算方式，都是可以的。

猜你喜欢

转载自blog.csdn.net/qq_29367075/article/details/108912262

深度学习《CNN架构续篇 - BatchNorm》

batchnorm

CNN和RNN中如何引入BatchNorm

一文弄懂CNN中的BatchNorm

深度学习《CNN架构续篇 - 正则化》

机器学习面试题之——BatchNorm

深度学习：BatchNorm、LayerNorm、InstanceNorm、GroupNorm和SwitchableNorm的理解

深度学习《CNN架构续篇 - 学习率衰减》

深度学习《CNN架构续篇 - 梯度下降的优化》

机器学习 - 解决梯度消失的方法(BatchNorm, Relu, residual network)

BatchNorm 理解

29、batchnorm

Pytorch BatchNorm

深入理解BatchNorm的原理、代码实现以及BN在CNN中的应用

深度学习《CNN架构续篇 - 1乘1卷积》

PyTorch学习之归一化层（BatchNorm、LayerNorm、InstanceNorm、GroupNorm）

batchnorm原理及代码详解

caffe的batchnorm层解析

batchnorm与dropout的区别

BatchNorm VS InstanceNorm

关于BatchNorm的理解与讨论

【转】Batchnorm原理详解

Operators in MXNet-BatchNorm

Pytorch中的BatchNorm

caffe 之batchnorm

深入理解Batchnorm

BatchNorm和Pool使用

PyTorch 卷积与BatchNorm的融合

BatchNorm与LayerNorm的比较

BatchNorm和Dropout的使用

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)