pytorch之常用的Normalization——Batch/Layer/Instance/Group Normalization

其他 2021-03-06 03:24:09 阅读次数: 0

文章目录

一、为什么要Normalization
二、常见的Normalization
三、Normalization总结
四、参考

一、为什么要Normalization

解决Internal Covariate Shift(ICS)：数据尺度/分布异常，导致训练困难的问题

二、常见的Normalization

在这里插入图片描述

1、Batch Normalization(见之前的博客文章)

2、Layer Normalization

在这里插入图片描述
总结：Layer Normalization顾名思义是根据每层的神经元来计算该层的均值和方差，也就是每层有自己的均值和方差。

pytorch实现代码
在这里插入图片描述

3、Instance Normalization

在这里插入图片描述
总结：Instance Normalization是针对图像迁移当中，每个batch中的图片风格是不同的，如果根据一个batch计算均值和方差是有问题的，这里面便根据每张图片的通道来计算均值和方差，也就是计算每张特征图的均值和方差。
pytorch代码实现
在这里插入图片描述
说明：Instance Normaliztion有1d/2d/3d的

4、Group Normaliztion

在这里插入图片描述
总结：有时候我们在训练过程中，如果batch设置过大的话，GPU和CPU的内存可能不够，但是如果batch较小的话，使用batch normalization的话效果也不好。针对这个问题，便提出了Group Normalization，通过将通道进行分组，分别计算每个组的均值和方差。例如有50个通道，分成两组的话，也就是计算25个通道的均值和方差。
pytorh实现代码
在这里插入图片描述

三、Normalization总结

在这里插入图片描述
该图很好的说明了每一种Normalization的计算方式的不同，Batch Normalization针对每批数据的特征维度计算均值和方差。Layer Normalization针对每层神经单元计算均值和方差。Instance Normalization对每个通道进行计算均值和方差。Group Normalization针对每组通道进行计算均值和方差。

四、参考

深度之眼pytorch框架班

猜你喜欢

转载自blog.csdn.net/weixin_43183872/article/details/108299558

pytorch之常用的Normalization——Batch/Layer/Instance/Group Normalization

Layer Normalization, Instance Normalization, Group Normalization

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

Normalization

pytorch之——Batch Normalization

Batch normalization和Instance normalization的对比

batch_normalization和layer normalization的区别

Batch Normalization与Layer Normalization的区别与联系

batch normalization（BN）& group normalization（GN）

PyTorch中的Batch Normalization

Batch Normalization

Layer Normalization

PyTorch验证group normalization

Group Normalization

《Group Normalization》

论文之Batch Normalization

pytorch常用normalization函数

Pytorch中的Batch Normalization操作

pytorch | 利用batch normalization对Variable进行normalize/instance normalize

Batch normalization和Instance normalization 在域适应问题中的的作用

tensorflow中Batch Normalization和Layer Normalization的实现

Batch normalization和Layer normalization有什么区别？

基于pytorch的transformer代码实现（包含Batch Normalization，Layer normalization，Mask等讲述）

Batch Normalization导读 Batch Normalization导读

深度学习之Batch Normalization

tensorflow之batch_normalization()

对Batch Normalization的理解

Batch Normalization层

batch normalization 详解

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)