yolov4 large

本文是YOLOv4的原班人马（包含CSPNet一作与YOLOv4一作AB大神）在YOLO系列的继续扩展，从影响模型扩展的几个不同因素出发，提出了两种分别适合于低端GPU和高端GPU的YOLO。该文所提出的YOLO-large在MSCOCO取得前所未有的精度(已公开的研究成果中最佳)，且可以保持实时推理；所提出的YOLO-tiny在RTX 2080Ti显卡上结合TensorRT+FP16等技术，可以达到惊人的1774FPS@batch=4.

论文标题：Scaled-YOLOv4:Scaling Cross Stage Partial Network
链接：https://arxiv.org/2011.08036
代码: https://github.com/WongKinYiu/ScaledYOLOv4
YOLOv4-CSP: https://github.com/WongKinYiu/ScaledYOLOv4/tree/yolov4-csp
YOLOv4-tiny: https://github.com/WongKinYiu/ScaledYOLOv4/tree/yolov4-tiny
YOLOv4-large: https://github.com/WongKinYiu/ScaledYOLOv4/tree/yolov4-large
Abstract

该文提出一种“网路扩展(Network Scaling)”方法，它不仅针对深度、宽度、分辨率进行调整，同时调整网络结果，作者将这种方法称之为Scaled-YOLOv4。
由此得到的YOLOv4-Large取得了SOTA结果：在MS-COCO数据集上取得了55.4%AP(73.3% AP50)，推理速度为15fps@Tesla V100；在添加TTA后，该模型达到了55.8%AP(73.2%AP50)。截止目前，在所有公开论文中，YOLOv-Large在COCO数据集上取得最佳指标。而由此得到的YOLOv4-tiny取得了22.0%AP(42.0%AP50)，推理速度为443fps@TRX 2080Ti；经由TensorRT加速以及FP16推理，batchsize=4时其推理速度可达1774fps。
该文的主要贡献包含以下几点：
设计了一种强有力的“网络扩展”方法用于提升小模型的性能，可以同时平衡计算复杂度与内存占用；
设计了一种简单而有效的策略用于扩展大目标检测器；
分析了模型扩展因子之间的相关性并基于最优划分进行模型扩展；
通过实验证实：FPN structure is inherently a once-for-all structure
基于前述分析设计了两种高效模型：YOLOv4-tiny与YOLOv4-Large。
在这里插入图片描述

猜你喜欢