对Batch Normalization 的理解 - 代码天地

对Batch Normalization 的理解

其他 2018-07-12 08:22:38 阅读次数: 0

之前看到防止过拟合的方法有dropout，L2正则化和Batch Normalization等，自己对前两种比较容易理解，而Batch Normalization为什么可以防止过拟合不太容易理解，于是上网查了一下资料，结合自己的想法总结一下。

BN会使参数搜索问题变得更加容易，使神经网络对超参数的选择更加稳定，超参数的范围会变得庞大，工作效果也很好，容易训练深层网络。
首先，BN提出来是为了解决internal covariate shift的（随着神经网络层数的增加，使得每一层的输入的分布在训练过程中发生很大变化，所以我们需要使数据改变分布），而BN就是在神经网络的训练过程中对每层的输入数据加一个标准化处理。

具体过程就是对网络所有卷积层的激活值进行批归一化处理,然后利用可学习的重构参数对归一化后的数据进行还原,最后对重构参数进行训练

这里写图片描述

传统的神经网络，只是在将样本x输入输入层之前对x进行标准化处理（减均值，除标准差），以降低样本间的差异性。BN是在此基础上，不仅仅只对输入层的输入数据x进行标准化，还对每个隐藏层的输入进行标准化。

这里写图片描述

Batch Normalization 限制了在前层的参数的更新，减少了输入值改变的问题，使输出值更加稳定，因此有轻微的正则化的效果。

Batch Normalization给隐藏层增加了噪音，有一定的正则化效果。

参考链接：

https://www.zhihu.com/question/275788133/answer/391635180
https://blog.csdn.net/whitesilence/article/details/75667002

猜你喜欢

转载自blog.csdn.net/wonitawonitawonita/article/details/80872049

对Batch Normalization的理解

对Batch Normalization 的理解

batch normalization 理解

理解Batch Normalization

Batch Normalization的理解

Batch Normalization理解

理解 Batch Normalization

从源头理解Batch Normalization

Batch_Normalization的理解

Batch Normalization 的原理解读

batch normalization学习理解笔记

深入理解Batch Normalization

深刻理解Batch Normalization

深度学习中batch_normalization的理解

Batch Normalization 以及dropout的原理解读

Batch normalization批标准化的理解

深入理解Batch normalization 的作用

深度学习--深入理解Batch Normalization

normalization 批标准化(batch normalization)理解

Batch Normalization

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

关于Batch Normalization的另一种理解

[转]深入理解Batch Normalization批标准化

深入理解batch normalization批标准化

【深度理解】Batch Normalization（批归一化）

【转】深入理解Batch Normalization批标准化

深度学习（11）BN(Batch Normalization) 原理理解

理解深度学习中Batch Normalization批标准化

Batch Normalization导读 Batch Normalization导读

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)