深度模型（九）：Batch Normalization - 代码天地

深度模型（九）：Batch Normalization

其他 2020-01-25 10:27:01 阅读次数: 0

批量标准化

批量标准化（batch normalaization）概念由2015年的论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》提出，后被广泛的应用于深度学习领域。

下面来看一下批量标准化的计算过程。

比如训练数据mini batch的大小为 $m$ ，某个特征 $x$ 的取值为 $[x_1,x_2,...,x_m]$ ，需要对特征 $x$ 做批量标准化，如何计算呢？

我们将 $x$ 的标准化的输出结果记为 $y=[y_1,y_2,...,y_m],y_i=BN_{\gamma,\beta}(x_i), i\in[1,m]$ ，则计算 $BN_{\gamma,\beta}$ 的过程如下：

$\mu=\frac{1}{m}\sum_{i=1}^mx_i$
$\sigma^2=\frac{1}{m}\sum_{i=1}^m(x_i-u)^2$
$\widehat x_i=\frac{x_i-u}{\sqrt{\sigma^2+\epsilon}}$
$y_i=\gamma x_i + \beta$

其中 $\gamma,\beta$ 为待训练的参数， $\epsilon$ 为超参。

本质思想

批量标准化的思想，来自于这样一个实验观察现象：当网络的输入分布符合标准分布的时候，训练会比较快的收敛。基于这样的现象，有理由可以猜想，如果网络的每一层的输入都符合标准分布，那么训练的过程应该更快。但是如果人为的改变上一层网络输出值的分布，可能会导致信息丢失，降低模型的表达能力，所以在标准化操作之后，引入的两个可学习的参数 $\gamma,\beta$ ，来学习原始分布与标准化分布间的映射关系。这样即加快的模型的训练，有不会降低模型的表达能力。

jony0917

发布了52 篇原创文章 · 获赞 105 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/gaofeipaopaotang/article/details/99869506

深度模型（九）：Batch Normalization

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

深度学习——Batch Normalization

【深度学习】 Batch Normalization

【深度学习】batch normalization

深度学习-Batch Normalization

【深度学习】：Batch Normalization

Batch Normalization

深度学习中的Batch Normalization

深度学习之Batch Normalization

深度学习-BN(Batch Normalization）

深度学习基础系列（九）| Dropout VS Batch Normalization? 是时候放弃Dropout了深度学习基础系列（七）| Batch Normalization

Batch Normalization导读 Batch Normalization导读

batch_normalization和layer normalization的区别

batch normalization（BN）& group normalization（GN）

Batch normalization和Instance normalization的对比

Batch Normalization与Layer Normalization的区别与联系

对Batch Normalization的理解

Batch Normalization层

batch normalization 详解

解读Batch Normalization

Tensorflow实现Batch Normalization

论文之Batch Normalization

Batch Normalization 学习笔记

[Tensorflow] Batch Normalization实现

Batch Normalization原理

对Batch Normalization 的理解

Batch Normalization (BN)

Tensorflow Batch normalization函数

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)