Caffe BN+Scale层和Pytorch BN层的对比 - 代码天地

Caffe BN+Scale层和Pytorch BN层的对比

其他 2019-03-09 07:10:55 阅读次数: 0

因为最近在将一个caffe的model移植到pytorch上，发现移植过去就没法收敛了，因此专门研究了一些细节。
batch normalization的公式如下：
$\frac{x-E[x]}{\sqrt{Var[x]}+\epsilon}*\lambda+\beta$
caffe和pytorch在代码细节上略有不同，但是基本功能是一样的。

Caffe 是使用BN层和Scale层来实现Batch normalization 的，简单地说就是BN层用来计算方差均值，Scale层进行归一化，这个很多技术博客都已经分析过了。
其中BN层中有三个mult_lr：0比较奇怪，经过查资料，我的理解是BN层记录了三个数据：均值、方差、滑动系数，这三个数据不需要学习，仅仅需要根据进入网络的数据进行计算，因此设置为0。据说新版的caffe已经不需要专门设置这三个数据了。
scale可以设置是不是需要bias，应该表示的是需不需要 $\beta$

Pytorch的BN层实现了计算均值方差并且归一化的步骤，现在不同的版本参数略有不同，最新的0.4.*版本多了一个参数。

class torch.nn.BatchNorm3d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)

momentum=0.001和caffe默认值0.999，应该是一个意思，只不过一个是计算的1-momentum。
affine表示要不要两个系数 $\gamma, \beta$ 。
track_running_stats是0.4新出的一个参数，据说是追踪var和mean的，目前不是很清除作用，等明白了再来更新。

猜你喜欢

转载自blog.csdn.net/elysion122/article/details/79628587

Caffe BN+Scale层和Pytorch BN层的对比

【转载】 Caffe BN+Scale层和Pytorch BN层的对比

Caffe BN层合并

caffe中bn层与scale层(还有卷积通道融合的一些解释)

caffe中的batchNorm层（caffe 中为什么bn层要和scale层一起使用）

caffe && pytorch BN

pytorch eval bn层

【pytorch】BN层计算

bn层

Caffe Scale层

PyTorch之—卷积层、激活层、BN

Caffe之Scale层源码

卷积层和BN层融合

BN层和CONV层合并

bn层的理解

BN层详解

BN层的主要作用

Pytorch-BN层详细解读

caffe | Concat层和Eltwise层对比解析

Caffe 源码 - BatchNorm 层与 Scale 层

Accelerating BN Networks& BN层加速？

LN和BN对比

[转载] ReLU和BN层简析

卷积神经网络卷积层BN层计算原理和卷积BN层融合

深度学习中的BN层

Tensorflow中BN层的使用

【转载】 Pytorch(1) pytorch中的BN层的注意事项

卷积层与BN层的融合方式

caffe加层

caffe的batchnorm层解析

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)