YOLOV5(三):模型结构要点及预测结果分析

本文主要参考江大白博客进行整理,罗列几项个人所需,并新增一些计算知识点

1.网络结构特点

在这里插入图片描述

1.1 Input

Mosaic数据增强

与yolov4相同的数据增强方式——Mosaic。采用数据集中的四张图片,用随机缩放、裁剪、排列的方式进行拼接,引用江大白的图:
在这里插入图片描述
用mosaic进行数据增强的优势:

  1. 随机缩放增加了很多小目标,在丰富数据集的同时,也提高了网络的鲁棒性。
  2. mosaic可直接计算四张图片,降低了mini-batch的大小,从而降低网络训练对硬件的压力。

自适应锚框

初始锚框的作用:网络在初始锚框的基础上计算出预测框,然后和标定的框做对比、迭代更新网络参数。

  • 在yolov3和4中,计算锚框的程序是单独运行的,而在yolov5中分两种方式,一种是使用预定锚框,可在yaml文件中查看并修改,另一种是在代码中启动自适应锚框计算功能。
    在这里插入图片描述
    在这里插入图片描述

1.2 Backbone

Focus结构

在这里插入图片描述
两个部分,一是切片,

猜你喜欢

转载自blog.csdn.net/abandononeself/article/details/132208273