目标检测新网络——Matrix Net (xNet)参数更少，训练更快

摘要
提出了一种新的深度目标检测体系结构——矩阵网(xNets)。xNets将具有不同大小和长宽比的对象映射到层中，这些层中对象的大小和长宽比几乎一致。因此，xnet提供了支持比例和高宽比的体系结构。我们利用xNets来增强基于关键点的对象检测。我们的架构在MS COCO上实现了47.8的mAP，这比任何其他的单镜头探测器都要高，同时使用了一半的参数和减少了3倍训练时间

论文：https://arxiv.org/pdf/1908.04646.pdf

1. 简介

基于关键点的目标检测器中，cornerNet通过检测角点，进行物体检测；centernet通过物体的中心进行目标检测。
同时，在不同的尺度进行目标检测也是十分重要的如特征金字塔网络（FPN），小目标通过靠前的特征图进行预测，大目标通过靠后的特征图进行预测。尽管FPNs提供了一种优雅的方式对于处理不同大小的对象，它们没有提供不同长宽比对象的任何解决方案。
文章提出了Matric Network来处理不同尺度，不同高宽比的物体
在这里插入图片描述

2. 模型结构

xNets每一层的特征用l_i，j表示每一个特征，l_1，1表示上图中最左上角的特征图，i表示宽度方向下采样2^i-1，同理，j表示高度方向下采样2^j-1，对角线上和FPN一样都是正规的矩形，非对角线上为矩形。上图中层接近右上角或左下角角的矩阵模型对象具有很高或很高低的纵横比。这样的物体非常罕见，所以这些层可以为了效率而修剪
2.1 网络参数优化
左上角的特征图，由一系列共享的3x3卷积，stride为1x2。类似地，左下角的层是使用带stride2 x1的共享3x3卷积获得的。所有下采样都共享这些参数通过卷积来最小化新参数的数量。

2.2 xnets的优点
矩阵网的主要优点是允许一个正方形卷积核来准确地收集信息不同的纵横比。在传统的目标检测模型中，如RetinaNet，需要一个平方卷积核来输出不同长宽比和尺度的盒子。这是反直觉的，因为不同的长宽比和比例需要不同的上下文。在矩阵网,相同的平方卷积核可以用来检测不同尺度和长宽比的盒子每个矩阵层中的上下文变化。因为对象大小是否在指定的层内几乎是一致的，宽度和高度的动态范围比较小其他架构，如FPNs。因此,回归物体的高度和宽度成为一个比较简单的优化问题。最后，MatrixNets可以用作任何对象检测架构的主干，基于锚的或基于关键点的单级或两级探测器

3. 结果

在这里插入图片描述

精度没有太大的提升，但是效率应该有一定提升

怡宝2号

发布了244 篇原创文章 · 获赞 147 · 访问量 28万+

私信关注