YOLOX:Exceeding YOLO Series in 2021

YOLOX:Exceeding YOLO Series in 2021


将YOLO检测器切换为无锚方式,并采用其他先进技术,解耦的头部和领先的标签分配策略SimOTA,以实现跨大规模模型范围的最新成果:对于仅有0.91M参数和1.08G FLOPs的YOLO-Nano, 在COCO上取得25.3AP,超越了NanoDet;对于yolov3,提升47.3%AP。

一 引言

YOLO系列始终追求实时应用中最佳速度和准确度的平衡,他们提取了当时最先进的检测技术(YOLOv2中的锚点,YOLOv3中的残差网络)
无锚框机制YOLOv4和YOLOv5都遵循YOLOv3的原始锚框机制流程,然而锚框机制存在许多已知问题。首先,在训练之前,需要进行聚类分析以确定一组最佳锚点,这些聚类锚点是特定领域的,不太通用,其次,锚定机制增加了检测头的复杂性,以及每个图像的预测数量,会存在延迟。

二 SimOTA

先进的标签分配是近年来目标检测的另一个重要进展,根据我们自己的OTA研究,我们总结了四个与先进标签分配相关的关键观点:

  • 对损失/质量敏感
  • 中心先验
  • 每个GT(简称动态Top-k)的正锚点数动态变化
  • 全局视图
    OTA满足了上述所有四个规则,因此我们选择它作为候选标签分配策略
    具体来说:OTA从全局角度分析标签分配,并将分配过程形式化为最优传输(OT)问题,获得了在当前分配策略中的最佳性能。
    在实践中,我们发现通过Sinkhorn-Knopp 算法解决OT问题会增加25%的训练时间,因此我们简化为动态top-k策略,并将其,命名为SimOTA以获得一个近似解。
    SimOTA首先计算每个预测-真值对之间的成对匹配度,用cost或quality表示。例如:在SimOTA中。GT和prediction之间的成本计算:
    请添加图片描述
    请添加图片描述
    SimOTA不仅减少了训练时间,还避免了Sinkhorn-Knopp算法中额外求解器超参数。SimOTA将检测器的AP提升了3.0%,从45.0%提高到了47.3%

请添加图片描述

猜你喜欢

转载自blog.csdn.net/shengweiit/article/details/132076365
今日推荐