FoveaBox: Beyond Anchor-based Object Detector 解读（一）

FoveaBox: 一种准确的灵活的完全无锚的物体检测框架。

FoveaBox直接学习对象存在的概率和相一致的边界框的坐标不在使用锚点的参照。实现方式主要有两种：（1）为目标存在的可能性预测类别敏感语义图；（2）为每一个可能包含目标的位置生成未知类别的边界框。

优点：之前几乎所有先进的目标探测器都是利用预定义的锚去计算要搜索目标的可能位置、尺寸大小以及目标的纵横比，但是锚的设计也限定了探测器的性能和泛化能力。

锚盒的缺陷：

（1）锚箱引入了额外的设计的超参数。设计锚箱的最要因素之一是如何密集地覆盖目标的空间位置。为了实现高的召回率，基于从数据训练集/验证集中计算统计数据精心设计锚。

（2）一种基于一些特定数据集的设计选择不总是适合其他的应用程序，导致泛化不足。例如：锚点通常是方形，用于面部检测。行人检测需要更高的锚盒。

（3）因为在图像中的大量候选目标位置被有规律的采样，密集目标探测器通常依靠有效技术去处理前景和背景不平衡挑战。

实验结果：FoveaBox在标准COCO检测基准上AP值达到42.1的最先进的单一模型的性能，尤其是对于具有任意纵横比的物体。

对于拉伸图像，FoveaBox表现出了良好的鲁棒性和泛化能力去改变边界框形状的分布。

一、简单介绍

对象检测主要解决的两大问题：识别和定位；对于给定一张任意图片，目标检测系统需要需要去判断是否在预定义的目录中存在一些语义对象的实例，如果存在，则返回空间的位置和范围。为了将定位功能添加到通用的目标检系统中，滑动窗口成为的多年来选择的方法。

最近，伴随着深度学习技术的出现，已经能够从数据中自动学习特征表示。R-CNN and Fast RCNN 利用几百万个与类别无关的区域建议来减少图像中搜索的空间。随后，区域建议生成阶段又被基于anchor的区域建议网络所取代，从此之后，锚框就被广泛用于搜索现代目标检测框架的可能感兴趣的区域。简而言之，锚框建议框空间（位置、尺寸、图像的纵横比）分成离散的区域，并且在相对应的区域重新定义目标框。大多数先进的探测器依赖锚框去计算目标对象可能的位置、尺寸和纵横比。锚对于两步检测的Faster RCNN],和FPN或者是单步检测SSD和 RetinaNet的最终边界框去预测区域是线性回归和分类候选。然而，锚盒被当做一种特征共享滑动窗口方案去覆盖目标可能存在的位置。

提高生成anchor的过程是使它变得灵活。最近有一些新的工作尝试提高锚盒的容量。在MetaAnchor中，锚函数从先前任意定义盒子中动态生成。指导锚方法共同预测物体中心可能存在的位置以及尺寸和纵横比。在Anchor box optimization for object detection中，作者建议动态学习锚的形状。不过这些研究仍然是依赖计算可能的尺寸和纵横比来优化模型。在 MetaAnchor中，锚函数的输入是有规律的采集不同输入纵横比和尺寸。在Guided-Anchoring中，作者假设固定每个锚点的中心和采样多对（w，h）去近似相对应的位置中心的最佳形状。

比较起来，人眼的视觉系统能够识别空间中实例的位置并预测给定视觉皮层图的边界，不需要预先定义的模板形状。换句话说，我们人类自然的识别视觉场景中的目标，并不需要枚举候选框。受到这个的启发，一个直觉的问题是：锚框是否能指导木匾搜索的最佳方式？答案是no，是否我们能够设计一个准确的物体检测框架而不依赖锚点或者是候选框？没有了候选框，人们期待一个复杂的实现可比较的结果。我们将展示一个惊人的简单和灵活的系统来匹配先前先进的目标检测的性能，并不在需要候选盒。

FoveaBox 呈现一个完全无锚盒的对象检测框架。FoveaBox的动机是来源于人眼的中央凹：视觉系统的中央具有最高的视力FoveaBox预测对象中心可能存在的位置以及每个有效位置的边界框。由于特征金字塔的表示，能轻而易举地从多个级别中检测到不用尺寸的对象。为阐述提出的检测方案的有效性，我们结合了特征网络的进展和我们检测头最新的进展形成了FoveaBox模型。FoveaBox在COCO目标检测任务中获得了最先进的单一模型实验结果。我们最好的单一模型是基于ResNeXt-101-FPN主干，在COCO test-dev中AP值达到了42.1，胜过了大多数以前公布的基于锚模型的单模型结果。

因为FoveaBox在训练和推理阶段不依赖与默认的锚盒，能够更强地分布边界框。为了验证，我们手工拉伸图像以及验证集的注释，并比较FoveaBox和之前基于锚的模型的鲁棒性。在这种环境下，FoveaBox大大优于基于锚的方法。我们相信FoveaBox的简单的训练和推理方式，以及灵活性和准确性，将有助于对象检测和相关主题的未来研究。

(后续相关工作接 FoveaBox: Beyond Anchor-based Object Detector解读（二））

FoveaBox: Beyond Anchor-based Object Detector 解读（一）

猜你喜欢