Batch Normalization & Layer Normalization

企业开发 2023-08-08 17:39:29 阅读次数: 0

Batch Normalization

目前在CV方面最主流的归一化方法为BN，BN的作用是为了解决梯度消失与梯度爆炸。BN作用是将参数拉回到激活函数比较敏感的区域。

归一化在计算过程中可以看到：
1.求数据均值
2.求数据方差
3.数据进行标准化
4.训练参数γ，β
5.输出y通过γ与β的线性变换得到新的值
在这里插入图片描述
按照样本，纵向地进行归一化，需要保存计算得到的均值和方差，用于inference，适用于batch-size较大，样本间分布较为集中的场景。

对于下图这种数据，类似传统的机器学习的数据，使用BN是非常合理的且效果不错。绿框是BN的范围
在这里插入图片描述

但是BN不大适用于RNN等序列数据

因为自然语言比较灵活，同一个位置的词在不同样本里出现的分布差异会很大，这和BN要求的分布集中有冲突，所以效果比较差。
另外自然语言处理句子的长度不是固定的，差别会很大。

Layer Normalization

在NLP中，一个字或者词会通过一个词嵌入矩阵来表示，这个矩阵的维度是多少你可以自行决定。在LN中，他处理的是每一个词嵌入矩阵中对应的特征来进行归一化。
听起来和上面说的好像没什么区别，但是在NLP的数据处理中，一个batch是好几句话组成的，一句话又通过好几个词嵌入矩阵构成。

总结

BN：不同样本，同一特征，归一化
LN：一句话，各个词嵌入的特征，归一化

猜你喜欢

转载自blog.csdn.net/CSTGYinZong/article/details/128497644

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

batch_normalization和layer normalization的区别

Batch Normalization与Layer Normalization的区别与联系

tensorflow中Batch Normalization和Layer Normalization的实现

pytorch之常用的Normalization——Batch/Layer/Instance/Group Normalization

Batch normalization和Layer normalization有什么区别？

Batch Normalization

Layer Normalization

Layer Normalization, Instance Normalization, Group Normalization

Batch Normalization导读 Batch Normalization导读

人工神经网络知识、激活函数、正则化、优化技术、Batch Normalization、Layer Normalization

基于pytorch的transformer代码实现（包含Batch Normalization，Layer normalization，Mask等讲述）

Batch Normalization层

解读Batch Normalization

batch normalization 详解

对Batch Normalization的理解

[Tensorflow] Batch Normalization实现

Batch Normalization 学习笔记

Tensorflow实现Batch Normalization

论文之Batch Normalization

Batch Normalization原理

Tensorflow Batch normalization函数

Batch Normalization (BN)

BN算法（Batch Normalization）

Batch Normalization Tensorflow代码

对Batch Normalization 的理解

BN(Batch Normalization)

batch normalization 理解

Batch Normalization参考博客

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)