[深度学习从入门到女装]Scale-Aware Trident Networks for Object Detection

论文地址:Scale-Aware Trident Networks for Object Detection

这篇文章是使用改变网络的感受野来提高目标检测的能力,其实感觉就是感觉把deeplab中的block用到目标检测中

文章对比了两种主流的结构,

第一种就是最原始图像金字塔,把原始图像缩放成不同尺寸,然后对这些不同尺寸的图像进行特征提取,在分别使用这些不同scale的特征进行predict

第二种是目前最流行的特征金字塔FPN,类似于一个U-Net的结构,对特征进行金字塔的构建,最后再从最小尺寸的特征再恢复到大尺寸的特征

第三种,也就是本文提出的方法,舍弃了金字塔的结构,使用空洞卷积来控制不同branch的感受野,对不同感受野的特征图进行predict

整体流程如上图所示,对backbone得到的特征图使用不同大小的空洞卷积进行处理,得到不同感受野的branch,然后对这些branch分别预测之后,使用NMS进行处理

本章中也对感受野对目标检测的影响做了实验

实验表明,大感受野会降低小目标的精度,提高大目标的精度

发布了164 篇原创文章 · 获赞 36 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/py184473894/article/details/103642395