Batch normalization（批量标准化） - 代码天地

Batch normalization（批量标准化）

企业开发 2022-06-30 09:30:05 阅读次数: 0

本文已参与「新人创作礼」活动，一起开启掘金创作之路。

简要概括：对每层的激活函数都进行标准化。可以对 $z^{[l]}$ 或者 $a^{[l]}$ 进行标准化，其中前者更常见。

1. Batch normalization原理

对于神经网络中的某些中间值 $z^{[l](i)},i=1,2,\cdots,m$ （下面省略 $l$ ），进行下列的一系列运算：

\begin{aligned} \mu&=\frac{1}{m}\sum z^{(i)}\\ \sigma ^{2}&=\frac{1}{m}\sum （z^{(i)}-\mu)^2\\ z_{norm}^{(i)}&=\frac{z^{(i)}-\mu}{\sqrt{\sigma^2+\epsilon}}\\ \tilde z^{(i)}&=\gamma z_{norm}^{(i)}+\beta\\ \tag{1-1} \end{aligned}

其中 $\gamma$ 和 $\beta$ 可以通过学习得到。

2. 在多层神经网络中的具体操作

实际操作时，对每个mini-batch进行batch-normalization。 $b^{[l]}$ 可以设置为零，因为不论它为多少，在batch-normalization时都会被减去。

\begin{aligned} z^{[l]}&=w^{[l]}a^{[l-1]}\\ z_{norm}^{[l]}&=\frac{z^{[l]}-\mu}{\sqrt{\sigma^2+\epsilon}}\\ \tilde z^{[l]}&=\gamma z_{norm}^{[l]}+\beta^{[l]}\\ \tag{2-1} \end{aligned}

for t=1...numMiniBatches compute forward prop on $X^{\{t\}}$ in each hidden layer, use BN to replace $z^{[l]}$ with $\tilde z^{[l]}$ use backprop to compute $dw^{[l]},db^{[l]},d\beta^{[l]},d\gamma^{[l]}$ update parameters(梯度下降方法及其各种改进)

3. Batch normalization有效的原因

类似于对输入层进行标准化的作用，可以加速学习过程。
使得后面的网络层更具有鲁棒性，当前面的网络层变化时，后面的网络层的均值和方差不变。换句话讲，减少了前面层参数和后面层参数之间的耦合
有轻微的正则化效果，因为采用了mini-batch的方法，均值和方差是在mini-batch上计算的而不是整个训练集，所以均值和方差中具有噪声，导致 $\tilde z$ 具有噪声。这个dropout有异曲同工之妙。

4. 测试时的处理手段

训练时，均值和方差是针对一个mini-batch来求的，但是测试的时候往往是一个一个样本进行的。解决方法，利用指数加权平均的方法，对训练集上的各个mini-batch进行指数加权平均，用来估计测试样本的隐藏层的均值和方差

猜你喜欢

转载自juejin.im/post/7109127481407799303

Batch normalization（批量标准化）

批标准化（Batch Normalization）、Tensorflow实现Batch Normalization

TensorFlow批标准化（Batch Normalization）

批标准化 (Batch Normalization)

Batch Normalization（批标准化）

批标准化 Batch Normalization

Batch normalization批标准化的理解

转: 批标准化Batch Normalization

normalization 批标准化(batch normalization)理解

深度学习基础（六）—— 批标准化 (Batch Normalization)

[转]深入理解Batch Normalization批标准化

深入理解batch normalization批标准化

【转】深入理解Batch Normalization批标准化

5.6 高阶内容-Batch Normalization 批标准化

5.5 高阶内容-什么是批标准化 (Batch Normalization)

理解深度学习中Batch Normalization批标准化

深度学习-批标准化（Batch Normalization）

深度学习 ——> Batch Normalization ——> 批标准化

深度学习——批标准化Batch Normalization

Batch Normalization批标准化是什么？ | BN有啥用 | Batch Normalization是什么

【深度学习】深入理解Batch Normalization批标准化

Batch Normalization 批标准化及其相关数学原理和推导

深度学习数据预处理——批标准化（Batch Normalization）

个人总结：从白化(whitening) 到批标准化(Batch Normalization)

批标准化详解（Batch Normalization for Reducing Internal Covariate Shift）

【标准化方法】(1) Batch Normalization 原理解析、代码复现，附Pytorch完整代码

Batch Normalization：Ioffe and Svegedy的批标准化实现 (BN处理对CNN的影响)

model.train()与model.eval()，标准化(Standardization)、归一化(Normalization），Dropout，Batch Normalization通俗理解

批量归一化（BN: Batch Normalization)

批量归一化(Batch Normalization)

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)