深度学习之目标检测系列(四)——YOLO v4剖析及迁移至PaddlePaddle框架

作者:禅与计算机程序设计艺术

1.简介

随着深度学习技术的不断进步、计算性能的提升以及模型的丰富度的增加,目标检测领域也进入了一个新的阶段。随着越来越多的研究者将注意力集中于基于深度学习的目标检测模型的设计与实现,出现了许多优秀的工作。其中,YOLO(You Only Look Once)网络在当年的目标检测领域有着很大的成就。自从YOLOv3被提出后,不断有其他的模型刷新记录并取得巨大的成功。但是在YOLOv4出来之前,主要的研究重点都放在如何解决YOLO的一些问题上。因此,本文将详细剖析YOLO v4的基本原理、技术细节、结构图、训练技巧、数据增强方法等方面,并且通过一个完整的实例,演示如何利用PaddlePaddle框架对YOLO v4进行迁移并进行预测。最后,我们还会回顾一下YOLO v4的优点、局限性以及未来的改进方向。

2.YOLO v4概述

YOLO(You Only Look Once)网络是在AlexeyAB团队提出的目标检测模型,相比与传统的基于Region Proposal的方法,YOLO网络只需要一次前向传播就可以输出整个检测结果。网络结构如下图所示: YOLO v4由多个模块组合而成,各个模块功能如下:

1.Darknet-53 模块 Darknet-53是一个轻量级卷积神经网络架构,由很多残差块组成,通过堆叠该模块可以快速得到较好的结果。其结构如下图所示:

2.Convolutional with anchor boxes模块 Convolutional with anchor boxes模块的作用是生成候选区域(anchor box),并且结合分类与回归两个子网络进行预测。它的结构如下图所示:

3.Pre

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132706226