多尺度检测(特征金字塔)(空间金字塔池化)(融合多层信息)的好处

例如

分割:

  sppnet中的spp空间金字塔池化结构;(spatial pyramid pooling)

  pspnet中的pyramid pooling moudle结构,综合讲是金字塔场景解析结构;

  deeplabv3+中的aspp结构,以及解码过程中联合编码部分信息的构造;(atrous spatial pyramid pooling)

检测:

  ssd中的使用多尺度的特征图投向最后的检测器;

  yolov3中使用的三个不同尺度,小尺度上采样融合前面特征变成大尺度;

  FPN中的top-down结构,改造的特征金字塔;

  trident net中的三叉戟结构,类似aspp结构;

 根据不同的任务,下面的理由适合解释多尺度的好处。

高层获得语义信息,适合复杂任务,大map分辨率大感受野小满足小目标需求的信息,

0.浅层的网络更关注于细节(位置)信息,高层的网络更关注于语义信息

高层的语义信息能够帮助我们准确的检测出目标

1.融合深层特征适合做复杂任务

图像中存在不同尺寸的目标,而不同的目标具有不同的特征,利用浅层的特征就可以将简单的目标的区分开来;利用深层的特征可以将复杂的目标区分开来;这样我们就需要这样的一个特征金字塔来完成这件事。

图中我们在第4层输出较大目标的实例分割结果,在第5层输出次大目标的实例检测结果,

在第6层输出较小目标的实例分割结果。因为在大的feature map上进行操作,可以获得更多关于小目标的有用信息(分辨率有关,第三条);

检测也是一样,我们会在第4层输出简单的目标,第5层输出较复杂的目标,第6层输出复杂的目标。

2.下采样倍数小的特征感受野小,适合小目标

另外在yolov3中对多尺度检测的理解是,1/32大小的特征图下采样倍数高,所以具有大的感受野,适合检测大目标的物体,1/8的特征图具有较小的感受野,所以适合检测小目标。

3.小尺度分辨率信息不足不适合小目标

对于小目标,小尺度feature map无法提供必要的分辨率信息,所以还需结合大尺度的feature map

猜你喜欢

转载自www.cnblogs.com/ywheunji/p/11022674.html