论文:Feature Selective Anchor-Free Module for Single-Shot Object Detection 阅读笔记

版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/m0_37263345/article/details/90604787

一、论文

Feature Selective Anchor-Free Module for Single-Shot Object Detection

https://arxiv.org/abs/1903.00621

https://www.cnblogs.com/fourmi/p/10602936.html

二、论文笔记

1、背景

a)、作者提出了一个FSAF网络结构块(feature selective anchor-free)。这个网络结构块可以添加到特征金字塔里面来提升检测精度。FSAF网络结构块主要是解决的基于anchor目标检测的两个问题 1. 启发式的引导特征选择 2. 基于重叠的anchor采样。FSAF的主要作用就是帮助我们的检测目标找到最适合他们的特征尺度。

b)、以前的工作都是人为的设计anchor box 的大小,并且人为的设计一些规则根据ground truth框的大小,在FPN上寻找对应大小的feature map 去回归框,(比如大的目标选择后面层语义信息更加丰富的feature map ,小目标选择前面层细节信息更多的feature map)

但是这种人为选择的方法,不够灵活,比如 50 * 50  和40 * 40 的目标可能会选择同一个feature map ,这样可能不是一个最好的选择。

2、创新点

a)、类似FPN中的anchor-based方法,每个feature map 设计一个anchor-free的分支,训练的时候根据目标的内容自动选择适合的feature map 进行回归,推测的过程可以单独使用anchor-free branch 也可以联合anchor-based branch 一起使用。

b)、网络结构

c)、分类分支使用的focal loss 回归分支使用的是iou loss

d)、通过计算每个实例在每个level feature map上的分类以及回归损失的和,选择损失较小的作为适合的feature map,

The intuition is that the selected feature is currently the best to model the instance

3、细节

a)、训练的时候将损失函数将anchor free 和anchor based 的损失叠加在一起

b)、Ground-truth and Loss

这部分参考https://blog.csdn.net/diligent_321/article/details/88384588

Classification Output

这个地方是对每个像素进行分类,所以这篇论文也可以看作是anchor free分支里边的使用类似于语义分割的套路来做的。

Box Regression Output

4、实验

这篇论文的实验,测试时使用了测试增强,另外最好的效果是加上了anchor based 分支一起的效果。

猜你喜欢

转载自blog.csdn.net/m0_37263345/article/details/90604787