Batch Normalization 对于神经网络的影响 - 代码天地

Batch Normalization 对于神经网络的影响

其他 2020-03-23 17:47:16 阅读次数: 0

在知乎上面看到一篇很好的文章关于 batch Normalization的。对于Batch Noremalization的理解很深刻。

我这里贴出一个主要的部分。要看完整版请
Batch Normalization 感谢作者。

BN的基本思想其实相当直观：因为深层神经网络在做非线性变换前的激活输入值（就是那个x=WU+B，U是输入）随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近（对于Sigmoid函数来说，意味着激活输入值WU+B是大的负值或正值），所以这导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因，而BN就是通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，意思是这样让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。

　　THAT'S IT。其实一句话就是：对于每个隐层神经元，把逐渐向非线性函数映射后向取值区间极限饱和区靠拢的输入分布强制拉回到均值为0方差为1的比较标准的正态分布，使得非线性变换函数的输入值落入对输入比较敏感的区域，以此避免梯度消失问题。因为梯度一直都能保持比较大的状态，所以很明显对神经网络的参数调整效率比较高，就是变动大，就是说向损失函数最优值迈动的步子大，也就是说收敛地快。BN说到底就是这么个机制，方法很简单，道理很深刻。

skyfengye

发布了88 篇原创文章 · 获赞 55 · 访问量 16万+

私信关注

猜你喜欢

转载自blog.csdn.net/nijiayan123/article/details/88353758

Batch Normalization 对于神经网络的影响

神经网络优化-Batch Normalization(BN)

神经网络训练的一些建议（Batch Normalization）

Batch Normalization 神经网络加速算法

卷积神经网络 Batch Normalization作用与原理

Batch Normalization —— 加速深度神经网络收敛利器

神经网络的归一化（batch normalization）

神经网络BN(Batch Normalization)层总结(下)

神经网络BN(Batch Normalization)层总结(上)

Batch Normalization

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

人工神经网络知识、激活函数、正则化、优化技术、Batch Normalization、Layer Normalization

batch_size对于卷积神经网络训练的影响

深度学习之经典神经网络框架详解（五）：Batch Normalization（BN层）网络详解

神经网络学习笔记1——ResNet残差网络、Batch Normalization理解与代码

Batch Normalization导读 Batch Normalization导读

Caffe下卷积神经网络（CNN）中的一些特殊层(Batch Normalization)

[改善深度神经网络] Hyperparameter tuning, Batch Normalization, Programming Frameworks习题解

Batch Normalization：加速神经网络训练的通用手段

卷积神经网络CNN（2）—— BN(Batch Normalization) 原理与使用过程详解

深度学习-卷积神经网络CNN-BN(Batch Normalization) 原理与使用过程详解

神经网络--CNN的池化、激活函数、批处理归一化Batch Normalization

Batch Normalization层

解读Batch Normalization

batch normalization 详解

对Batch Normalization的理解

[Tensorflow] Batch Normalization实现

Batch Normalization 学习笔记

Tensorflow实现Batch Normalization

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)