YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进【NO.78】引入2023年华为诺亚提出Gold-YOLO模型中Gatherand-Distribute

前言
作为当前先进的深度学习目标检测算法YOLOv8，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv8的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv8，YOLOv7、YOLOv5算法2020年至今已经涌现出大量改进论文，这个不论对于搞科研的同学或者已经工作的朋友来说，研究的价值和新颖度都不太够了，为与时俱进，以后改进算法以YOLOv7为基础，此前YOLOv5改进方法在YOLOv7同样适用，所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他目标检测算法同样可以适用进行改进。希望能够对大家有帮助。

一、解决问题

尝试引入新进算法的模块结合新的算法思想，提升检测模型的检测效果。

二、基本原理

论文原文：[2309.11331] Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism (arxiv.org)

论文代码：https://github.com/huawei-noah/Efficient-Computing/tree/master/Detection/Gold-YOLO

摘要：在过去的几年里，YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改架构、扩充数据和设计新的损失，将基线提升到了更高的水平。然而，我们发现以前的模型仍然存在信息融合问题，尽管特征金字塔网络（FPN）和路径聚合网络（PANet）已经缓解了这一问题。因此，本研究提供了一种先进的聚集和分布机制（GD）机制，该机制通过卷积和自注意操作来实现。这个新设计的模型名为Gold YOLO，它增强了多尺度特征融合能力，并在所有模型尺度上实现了延迟和准确性之间的理想平衡。此外，我们首次在YOLO序列中实现了MAE风格的预训练，使YOLO序列模型可以从无监督预训练中受益。Gold-YOLO-N在COCO val2017数据集上获得了39.9%的出色AP，在T4 GPU上获得了1030 FPS，这比之前的具有类似FPS的SOTA模型YOLOv6-3.0-N高出+2.4%。