GIoU

作者 | ywsun

论文链接 | arxiv.org/abs/1902.0963

原文地址 | https://zhuanlan.zhihu.com/p/57863810

作者没有对网络结构进行改进，反而是从一个特殊的视角来考虑目标检测的改进点——使用基于IOU的度量来代替传统回归的损失。

作者的主要贡献是：

1.提出了IOU的通用版本——GIOU，作为比较两个任意形状的新指标；
2.提供了将GIOU作为二维坐标框对齐时的loss方案；
3.主要在Faster/Mask RCNN与YOLO v3上面进行试验，证明在two-stage与one-stage上面均表现很好。

Bounding box回归是2D/3D视觉任务总的基础模块。目标检测、实例分割等等都需要bbox回归来获得较为准确地定位。目前来讲，想要获得更好的检测效果，要么使用重的backbone，要么设计更好的网络结构。但是这两种方案都忽略了bbox regression中基于IOU计算度量的L1/L2 loss。

IOU

IOU是目标检测中的一个重要的概念，在anchor机制中，IOU的作用不仅仅在于确定正负样本（0.5），还可以用来评价预测框和真实框之间的距离。

IOU有一个很好的特性就是对尺度不敏感（scale-invariant）。在回归的任务中，判断pre-bbox与gt-bbox离最直接的指标就是IOU，但是所采用的loss函数却不太适用，如下图所示：