pytorch中batch normalisation的注意事项

其他 2018-06-26 08:06:25 阅读次数: 3

torch中的各种批归一的注意事项，不间断更新20180402

含有batchnorm的网络其train和eval时效果差距大

和是否zero_grad及其位置关系不大，因为这个错了，train是多半不收敛的。
主要是因为BN的输入随着训练的进行是时变的，非稳态的，除非训练完全收敛，且学习率很小，并进行了多个batch的训练，此时的running mean 和running var才会收敛到正确的值。
如果BN的动量为0.1，那么需要多训练的batch数我认为至少是20，即0.9**20=0.1214，也就是说20个batch前的训练数据在running mean和var中所占比重约十分之一。
建议：当需要用eval运作网络时，最好先以train模式进行多个batch的前向传播，用于稳定running mean和var。

torch.nn.BatchNorm2d

输入4D的矩阵，NxCxHxW
C维度取Ci时可计算得到MEANi和VERi，分别是改通道对应的均值和方差
可见该批归一化过程是通道间独立的。
所以，如果batch中N=1也是可以正常运作的，这点区别于最早的批归一文章。

猜你喜欢

转载自blog.csdn.net/huntstart/article/details/79786582

pytorch中batch normalisation的注意事项

pytorch使用注意事项

【转载】 Pytorch(1) pytorch中的BN层的注意事项

开发中的注意事项

python 中的 in is ==注意事项

中软注意事项

pytorch fine-tuning注意事项

pytorch的常用操作、技巧、注意事项

Pytorch创建张量与使用注意事项

pytorch optimizer使用注意事项

[pytorch] 自定义激活函数中的注意事项

java中异常中的注意事项

IDEA中Junit使用注意事项

Direct中灯光的注意事项

集合中的取并集的注意事项

java中toArray用法注意事项

maven中的snapshot来源与注意事项

IOS 中NSTimer使用注意事项

消息队列在使用中的注意事项

【缓存使用中的注意事项】

工作中的注意事项、细节

java中的包注意事项

JQuery中each的使用及注意事项

oracle中sql注意事项总结

学python中的注意事项

vector中erase用法注意事项

mybatis中数组传递注意事项

hive中where子句的注意事项

Hive中索引的使用及注意事项

Vue中改变对象的注意事项

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)