ECCV2018 | 论文阅读DetNet: A Backbone network for Object Detection

持续更新~~~

目前大部分的目标检测网络,包括one-stage和two-stage法,都是直接对用于图像分类的ImageNet预训练模型进行微调,很少有专门为目标检测设计的特征提取器。更重要的是,图像分类和物体检测之间存在许多差异:
(i)最新的物体探测器如FPN和RetinaNet通常需要图像分类任务以外的部分,来处理目标检测所关注的物体的尺度问题。
(ii)图像分类只需要识别物体的类别,而目标检测不仅要对物体进行匪类,还要定位物体的空间位置。 大尺度的降采样操作增大了感受野,有利于图像分类,但是对于需要定位目标的检测任务而言就不一定有利,因为降采样操作会降低图像分辨率,丢失了目标的位置信息,对于大目标的定位和小目标的识别实在不利。
由于分类与检测任务的各种不同,本文设计了一种专为目标检测的主干网络—— DetNet。
由于目标检测存在物体的尺度问题,DetNetFPN中添加了额外的部分。 与用于ImageNet分类的传统预训练模型不同,即使包括额外的部分,我们仍可以保持特征的空间分辨率。为了保持DetNet的效率,我们采用了低复杂度的膨胀瓶颈结构。 通过集成这些改进点,我们的DetNet不仅可以保持高分辨率的特征图,还可以保留较大的感受野,这两者对于目标检测任务都非常重要。

猜你喜欢

转载自blog.csdn.net/weixin_40414267/article/details/86298536