batch normalization 批归一化 --- 一个硬币的两面 - 代码天地

batch normalization 批归一化 --- 一个硬币的两面

其他 2018-12-08 18:18:01 阅读次数: 0

本文主要是对BN(batch normalization)这篇论文的摘录，加上一些其他论文，辅助理解。

批归一化是在Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 这篇论文中提出的，主要的思想就是要将每一个隐藏神经元的输入变成是一个均值为0，方差为1的分布，便于加快training过程。

----------------------------------作者这么说----------------------------------------------------------------
具体实施是这样的

对于每一次的mini-batch会去算一波均值和方差，当然，这些x是针对一个神经元的输入了

在推断的过程中，也要做归一化，因为推断的时候只有一个样本输入，方差和均值的计算其实是之前的若干个mini-batch的均值和方差的平均

这个地方需要注意的一点是，方差采用的是无偏估计，对每一个mini-batch，计算出来的方差用的是下面这个式子。不明白的是为什么这个地方采用无偏估计，而之前不采用呢，估计是为了引入noise，有一个类似drop out的作用？

具体在使用的过程中，BN这一层呢，一般是加在非线性层之前，就是relu之类的之前。

对于CNN网络来说，BN是一个feature map共用一个gamma和beta，因为默认不光是一个神经元的输入应该满足同一个分布，而是同一个feature map的都应该满足，所以如果feature map是q*p的大小，对于大小为m的mini-batch而言，其实是计算m*p*q的整个的均值和方差，而不是像之前只要计算m个input值的。

--------------------------------------------其他论文这么说-------------------------------------------------------------

下面看到的这个段落来自super resolution中著名的网络EDSR论文，在这篇论文中，作者没有用到BN，他们的说法是因为BN层会让特征被归一化，从而降低变化范围的自由度。他们的实验证明了去掉BN层会让图像细节部分表现更好。并且，他们表示，去掉了BN层之后，GPU的内存使用也被极大地减小了，因为BN层和卷积层占用一样多的内存。

猜你喜欢

转载自www.cnblogs.com/sunny-li/p/10088472.html

batch normalization 批归一化 --- 一个硬币的两面

批归一化Batch Normalization

批归一化（Batch Normalization）

批归一化(Batch Normalization)

批归一化（Batch Normalization，BN）

机器学习------批归一化（Batch Normalization, BN）

批归一化Batch Normalization的原理及算法

CNN 中的BN（batch normalization）“批归一化”原理

【深度学习】批归一化（Batch Normalization）

【深度理解】Batch Normalization（批归一化）

批归一化（Batch Normalization）详细解释笔记

归一化（Batch Normalization）

批量归一化（BN: Batch Normalization)

批量归一化(Batch Normalization)

Pytorch 批量归一化（Batch Normalization）

批归一化Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift论文详解

深度学习入门笔记（十三）：批归一化（Batch Normalization）

批归一化（Batch Normalization）、L1正则化和L2正则化

归一化（Normalization）、标准化（Standardization）和中心化/零均值化（Zero-centered）,BN,Batch,批归一化,从归一化到批归一化

从头学pytorch(十九):批量归一化batch normalization

批量归一化：Batch Normalization层原理+Pytorch实现

神经网络的归一化（batch normalization）

Batch Normolization(批归一化）

tensorflow实践-batch normalization（一）

归一化（Normalization）

批标准化（Batch Normalization）、Tensorflow实现Batch Normalization

model.train()与model.eval()，标准化(Standardization)、归一化(Normalization），Dropout，Batch Normalization通俗理解

神经网络--CNN的池化、激活函数、批处理归一化Batch Normalization

深度学习 --- 优化入门四（Batch Normalization（批量归一化）一）

深度学习论文1--批量归一化（Batch Normalization:Accelerating...）

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)