本文主要参考江大白博客进行整理,罗列几项个人所需,并新增一些计算知识点
1.网络结构特点
1.1 Input
Mosaic数据增强
与yolov4相同的数据增强方式——Mosaic。采用数据集中的四张图片,用随机缩放、裁剪、排列的方式进行拼接,引用江大白的图:
用mosaic进行数据增强的优势:
- 随机缩放增加了很多小目标,在丰富数据集的同时,也提高了网络的鲁棒性。
- mosaic可直接计算四张图片,降低了mini-batch的大小,从而降低网络训练对硬件的压力。
自适应锚框
初始锚框的作用:网络在初始锚框的基础上计算出预测框,然后和标定的框做对比、迭代更新网络参数。
- 在yolov3和4中,计算锚框的程序是单独运行的,而在yolov5中分两种方式,一种是使用预定锚框,可在yaml文件中查看并修改,另一种是在代码中启动自适应锚框计算功能。
1.2 Backbone
Focus结构
两个部分,一是切片,