batch norm, layer norm, instance norm, group norm - 代码天地

batch norm, layer norm, instance norm, group norm

企业开发 2023-06-05 08:26:23 阅读次数: 0

一、Batch Norm

假设我们的输入是一个shape为(N,C,H,W)的向量，其中N表示Batch size的大小，C表示channel数量，H为height，W为width。那么Batch Norm就会在整个batch的每个channel上计算一次均值和方差，并对每个channel进行归一化。计算过程为：

要再次强调的是，上面的计算都是在每个channel上进行的，有几个channel就会算出几个均值和方差。另外值得一提的是，这里有一个γ和β，他们是模型可以学习的参数。并不是模型的每一层都需要进行归一化，当γ = \sqrt{\sigma^2 + \epsilon}，且 β = μ 时，就还原成了没有归一化的数据。ϵ是为了预防分母为0而加的一个很小的数。

一般都是训练的时候在训练集上通过滑动平均预先计算好平均-mean，和方差-variance参数，在测试的时候，不在计算这些值，而是直接调用这些预计算好的来用，但是，当训练数据和测试数据分布有差别是时，训练集上预计算好的数据并不能代表测试数据，这就导致在训练，验证，测试这三个阶段存在inconsistency。

batch size如何设置：科研调参：batch_size怎么设置？_无枒的博客-CSDN博客_batchsize设为1

二、Layer Norm

在一个数据的所有channel上计算均值和方差

三、Instance Norm

用一条数据一个channel上的数据进行归一化

四、Group Norm

取一部分的channels作为一个group进行归一化

当GN中的#G=1是，GN就成了Layer Norm
当GN中的#G=C(通道数)时，GN就成了Instance Norm

五、对比

相同batch size(32)时，BN,GN效果较好

不同batch size时，BN和GN对比。GN受batch size影响较小

不同group size时，GN的表现。#G为32时较好

Group Norm虽然解决了单卡batch size小时模型表现部好的问题，但是也带来了一个需要调节的超参数group size。这也意味着要做更多的实验。

参考：

batch-size较小时还能用batch normalization吗？_折磨王的博客-CSDN博客_batchsize为1时还要用batchnorm吗

论文阅读 - Group Normalization_zjuPeco的博客-CSDN博客

猜你喜欢

转载自blog.csdn.net/qq_41021141/article/details/126057078

Batch Norm/Layer Norm/Instance Norm /Group Norm/Switchable Norm

batch norm, layer norm, instance norm, group norm

Group Norm，Batch Norm，Layer Norm

标准化归一化 batch norm, layer norm, group norm, instance norm

norm

bn两个参数的计算以及layer norm、instance norm、group norm

深度学习方法（十六）：Batch Normalization及其变种——Layer Norm, Group Norm，Weight Norm等

2.3.2 Batch Norm介绍

batch-norm

关于batch norm

5.10_batch-norm

caffe中融合convolution layer和batch norm layer

batch norm反向公式推导

Batch Norm的原理和作用

vector norm

matrix norm

Norm比较

caffe-batch norm层理解

slim的batch_norm出现的问题

关于tensorflow 的 batch_norm问题

caffe中batch norm源码阅读

动手学pytorch-Batch Norm

超参数调试与BN(Batch Norm)

范数 norm 对偶范数 dual norm

Frobenius norm(Frobenius 范数)

n-norm 范式

范数的概念-Norm

torch.norm的理解

norm.ppf()

深度学习-norm

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)