对Batch Normalization的理解

其他 2018-05-28 07:43:25 阅读次数: 0

从别处看到说BN本质上是解决反向传播过程中的梯度decay和blow-up的问题。

为了增加理解和记忆，这里举一个特别简单的例子，希望能够说明白。

就以一维为例，设输入的就是x_i,i =1, 2,...,m

w为权，

这里高bias 为0,

输出为f=wx.

那么显然，f对x的导数为w

如果网络很deep的话，比如说100层，那么就有可能会出现 1.1^100 or 0.9^100，这种情况。

那么BN为何能用到这里呢？

formally 看的话，BN（wx）= \gamma ((wx-\mu)/ (\sigma)) + \beta.
所以再对x求导，是 (\gamma)/(\sigma) w,
再formally看， \sigma^2 = mean(wx-\mu)^2 \sim w^2
所以w 和 \sigma的量级是一样的，也就是说把w的scale给吃掉了。
给\gamma可以自己给定，这样就可变得可控了

猜你喜欢

转载自blog.csdn.net/qfpkzheng/article/details/79952463

对Batch Normalization的理解

对Batch Normalization 的理解

batch normalization 理解

理解Batch Normalization

Batch Normalization的理解

Batch Normalization理解

理解 Batch Normalization

从源头理解Batch Normalization

Batch_Normalization的理解

Batch Normalization 的原理解读

batch normalization学习理解笔记

深入理解Batch Normalization

深刻理解Batch Normalization

Batch Normalization

深度学习中batch_normalization的理解

Batch Normalization 以及dropout的原理解读

Batch normalization批标准化的理解

深入理解Batch normalization 的作用

深度学习--深入理解Batch Normalization

normalization 批标准化(batch normalization)理解

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

Batch Normalization导读 Batch Normalization导读

关于Batch Normalization的另一种理解

[转]深入理解Batch Normalization批标准化

深入理解batch normalization批标准化

【深度理解】Batch Normalization（批归一化）

【转】深入理解Batch Normalization批标准化

深度学习（11）BN(Batch Normalization) 原理理解

理解深度学习中Batch Normalization批标准化

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)