ResNet V1 vs V2详解 - 代码天地

ResNet V1 vs V2详解

其他 2018-11-17 13:54:10 阅读次数: 0

最近看李沐的gluon课程提到了conv、bn、relu等的顺序问题，现将resnet v1和v2总结如下。

首先给出resnet v2的paper里面kaiming大神给出的不同的结构对比：

图a为resnet v1的结构，图e为resnet v2的结构。（weight为conv层），左分支为identity分支，右分支为residual分支。

图的结构有两个特点：1、conv-bn-relu；2、最后的relu在addition后面，这么为什么这么做呢，下面我将一一讲解。

如果我们把relu作为residual分之的结尾，即图c所示，这样做会导致该分之经过relu后永远为非负值，这样在做forward的时候输入会单调递增，从而影响该层的表达能力，所以我们希望resdiual分支的结果应该为R。如果按照图c这样的做法，导致bn改变了分支的分布。

如果按照图b的做法，这里bn改变了identity的分支的分布，影响了信息的分布，在训练的时候会阻碍loss的下降，导致不能优化。

那么为什么identity分支的改变会影响其信息传递从而影响训练呢？下面的推导可以很好的解释这个问题。

根据上面的推导可以看出：如果identity改变，即导致h(x) != x，不管是左relu还是做线性映射变换（h(x)=ax），都会导致信息传递问题，详细的说明见上面的推导。

总结：图b（bn after addition）：效果差，因为bn在addition后会改变分布，影响传递，会出现的现象就是训练初期误差下降缓慢。

图c（relu bafore addition）：这样做或导致residual分支的分布为非负，会影响模型的表达能力。

图d和图e有两个特点：1、f为恒等变换，整个网络更易于优化；2、使用bn作为预激活函数可以加强对模型的正则化。

猜你喜欢

转载自blog.csdn.net/gbyy42299/article/details/81505083

ResNet V1 vs V2详解

ResNet V1 ,ResNet V2,ResNeXt,DenseNet

ResNet V1和V2的区别

详解深度学习之经典网络架构（六）：ResNet 两代（ResNet v1和ResNet v2）

Resnet V1论文阅读和代码解析

【Keras-Inception-resnet v1】CIFAR-10

经典卷积神经网络总结：Inception v1\v2\v3\v4、ResNet、ResNext、DenseNet、SENet等

TensorFlow实现ResNet V2

ResNet v2笔记

论文笔记：ResNet v2

yolo v1, v2

EfficientNet v1 v2

MobileNet V1、V2网络详解及V2复现

YOLO v1,v2,v3

yolo v1 v2 v3

DeepLab v1、v2、v3

mobilenet v1\v2\v3

Inception v1 v2 v3

LeNet-5、AlexNet、NIN、VGG(VGG16、VGG19)、GoogLeNet(Inception v1 v2 v3 v4)、Xception、ResNet、DenseNet

ResNet v2文章翻译及复现

pytorch 实现 inception resnet v2 网址

Resnet V2论文阅读和代码解析

【Keras-Inception-resnet v2】CIFAR-10

MobileNet v1 v2 v3 网络详解笔记

论文阅读笔记：残差神经网络(ResNet v1)

apk 签名v1与v2的区别

Deeplab V1、v2要点

Android Studio 打包 V1 V2 签名

Android 签名时 v2 与 v1 的选择

MobileNet v1 和 v2 记录

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)