Res2Net------论文理解 - 代码天地

Res2Net------论文理解

其他 2019-04-13 10:51:20 阅读次数: 0

1. 设计网络的动机

目前现有的特征提取方法大多都是用分层方式表示多尺度特征。分层方式即要么对每一层使用多个尺度的卷积核进行提特征（如SPPNet），要么就是对每一层提取特征进行融合（如FPN）。

本文提出的Res2Net在原有的残差单元结构中又增加了小的残差块，增加了每一层的感受野大小。Res2Net也可以嵌入到不同的特征提取网络中，如ResNet, ResNeXt, DLA等等。

2. Res2Net

2.1 Res2Net网络模型

上图左边是最基本的卷积模块。右图是针对中间的3x3卷积进行的改进。

首先对经过1x1输出后的特征图按通道数均分为s（图中s=4）块，每一部分是xi，i ∈ {1,2,...,s}。

每一个xi都会具有相应的3x3卷积，由Ki（）表示。我们用yi表示Ki（）的输出。

特征子集xi与Ki-1（）的输出相加，然后送入Ki（）。为了在增加s的同时减少参数，我们省略了x1的3×3卷积，这样也可以看做是对特征的重复利用。

（*代表卷积操作）

y1 = x1；

扫描二维码关注公众号，回复： 5871141 查看本文章

y2 = x2*（3x3）= K2；

y3 =（x3 + x2*（3x3））*（3x3） = （K2 + x3）*（3x3）= K3 ；

y4 =（x4 +（x3 + x2*（3x3））*（3x3））*（3x3） = （K3 + x4）*（3x3）= K4

如此一来，我们将得到不同数量以及不同感受野大小的输出。比如y2得到3x3的感受野，那么y3就得到5x5的感受野，y4同样会得到更大尺寸如7x7的感受野。

最后将这四个输出进行融合并经过一个1x1的卷积。这种先拆分后融合的策略能够使卷积可以更高效的处理特征。

在本文中，我们将s设置为比例尺寸的控制参数，也就是可以将输入通道数平均等分为多个特征通道。s越大表明多尺度能力越强，此外一些额外的计算开销也可以忽略。

2.2 与其他网络做融合

目前已经有大量的神经网络提出并且被应用，比如ResNeXt和SENet。上图中将这两个网络运用到Res2Net中。

首先是ResNeXt中的维度基数（Dimension cardinality），主要是利用分组卷积，将输出的通道维数平均分为c组，分别进行卷积，最后通过concat进行连接，使输入维度和输出维度相同。

（

若输入和输出维度都为256，用3x3的卷积核进行卷积，参数量为3x3x256x256.
但若使用分组卷积，比如将通道数分为8组，每组通道数即为32，则参数量为3x3x32x32x8.远远小于上个参数量。

最初是在AlexNet中用到，为了使用多个GPU进行训练过。Alex认为group conv的方式能够增加 filter之间的对角相关性，而且能够减少训练参数，不容易过拟合，这类似于正则的效果。

）

本文是对每个块下的3x3卷积进行分组，每一组的通道数变为channel/c。

然后，在最后的1x1卷积后加上SENet，其主要通过建模通道数之间的相互依赖性自适应地校准每个通道的特征响应，即为每一个通道分配权值，该权值代表每个通道的影响力。

猜你喜欢

转载自blog.csdn.net/ruoruojiaojiao/article/details/89074763

Res2Net------论文理解

Bi-Real net论文理解

YOLO v2论文理解

R-CNN论文理解（2）

MTCNN 论文理解

论文理解：SSD

AlexNet论文理解

论文理解：DenseNet

论文理解：ResNet

SSD 论文理解

RetinaNet论文理解

AdaSale 论文理解

SENet论文理解

[论文理解] CapsuleNet

MaskRCNN论文理解

PReMVOS论文理解

NOCS论文理解

Bert论文理解

Alphapose 论文理解

RepVGG论文理解

ShuffleNet-V2论文理解及代码复现

Res2Net

Res2Net: A New Multi-scale Backbone Architecture（Res2Net 论文机翻）

转SSD论文理解

ResNeXt-------论文理解

SKNet-------论文理解

SPPNet---------论文理解

Faster RCNN论文理解

[ML]LightGBM论文理解

[论文理解] Receptive Field Block Net for Accurate and Fast Object Detection

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)