DSSD:Deconvolutional Single Shot Detector-------论文理解

参考博客:https://blog.csdn.net/jesse_mx/article/details/55212179?utm_source=itdadao&utm_medium=referral

1. 概述

改论文中,作者总的有两个贡献:

一,将原始的SSD中用到的骨干网络vgg-16换为resnet-101,目的是为了使特征提取能力更强;

二,检测网络中,在原有SSD后添加的几个层之后加入额外的反卷积层,目的是使网络可以提取到更丰富的上下文信息。

2. 网络模型

在此,详细讲解反卷积模块 。

正常情况下,反卷积模型在编码和解码阶段应该包含对称的层。但论文中作者并没有用到对称性,而是将反卷积模块设置的相对较浅,原因有两个:一,检测是视觉的基本任务,可能需要为下游任务提供信息。 因此速度很重要。设置对称的编码解码阶段导致时间翻倍。二,反卷积部分没有预训练模型,因为分类提供了一个完整的图像标签,而不是检测中的全局标签。如果模型从头开始学将导致对称编码解码浪费的时间更多。

具体的操作步骤如下:

首先,在每一个卷积层之后计入BN;
其次,使用反卷积层代替双线性插值;
最后,尝试使用点对点相加和点对点相乘。实验证明,点对点相乘精确度更高。

3. 实验

猜你喜欢

转载自blog.csdn.net/ruoruojiaojiao/article/details/89278786