深度学习（24）——YOLO系列（3）

企业开发 2023-09-06 18:48:02 阅读次数: 0

深度学习（24）——YOLO系列（3）

今天YOLOv4理论版

1. BOF(bag of freebies)

只增强训练成本，但是能显著提高精度，但是不影响推理速度
数据增强：调整亮度，对比度，色调，随机缩放…
网络正则化的方法：dropout，dropblock
类别不平衡——>损失函数设计

2. Mosaic data augmentation

参考cutmix，以前就存在，将增强的四张图像拼接在一张进行训练（相当于间接增加batch）

3. 数据增强

random erase：随机遮挡或擦除
hide and seek:根据概率随机隐藏补丁

4. self-adversarial-training（SAT）

在原始图像中增加噪音点干扰

5. dropblock

dropout是随机选择一些点遮住（游戏难度增加不大），dropblock现在遮住一个区域（游戏难度增大）
在这里插入图片描述

6. label smoothing

神经网络最大的缺点，标签绝对，容易过拟合
使用之后，簇内更紧密，簇间更分离

7. 损失函数

a. IOU损失

相同的IOU却反映不出实际情况到底是怎么样的
当交集为0时，没有梯度无法计算（梯度消失）

b.GIOU

在这里插入图片描述

引入最小封闭框C（C可以把A,B包含在内）
在不重叠的情况下可以使预测框尽可能靠近真实框
解决了梯度下降的问题，但是重叠的时候失灵

c. DIOU

在这里插入图片描述

附加项的分子项：预测框与真实框中心点的欧氏距离
附加项的分母项：最小封闭框的对角线长度C
直接优化距离，速度更快，并解决GIOU

d.CIOU

在这里插入图片描述

考虑三个几何因素：
- 重叠面积
- 中心点距离
- 长宽比（v）

8. SPPNet（spatial pyramid pooling）

为了更好满足不同输入大小，训练的时候要改变输入数据的大小
SPP其实就是用最大池化来满足最终输入特征一致即可

9. CSPNet（cross stage partial network）【更快】

在这里插入图片描述

每个block 按照特征图的channel维度拆分成两部分
一份正常走网络，另一份直接concat到这个block的输出

10.CBAM & SAM

在这里插入图片描述

计算量太大！所以在V4中，引入SAM ，没有channel之间的attention，只有spatial空间attention（attention可以让模型更好学习特征）

11.YOLO中的attention链接机制

在这里插入图片描述

12. PAN

FPN是自顶向下的模式，将高层特征传下来，高层逐层向下兼容下层（单向）
缺少底层到高层，PAN登场
引入自底向上的路径，使得底层信息更容易传到顶部
还是一个捷径，红色的可能要走100+层，绿色只需要几层就OK

13. PAN的连接方式

在这里插入图片描述

14. 激活函数

在这里插入图片描述

15. 网络结构

在这里插入图片描述

16.优点

使用单个GPU就可以训练很好
量大核心方法：数据层面+网络层面
消融实验
速度快，性能高！

猜你喜欢

转载自blog.csdn.net/qq_43368987/article/details/131269639

深度学习（24）——YOLO系列（3）

学习：yolo系列之yolo v3【深度解析】

深度学习：YOLO系列

yolo系列之yolo v3【深度解析】

深度学习系列之YOLO 个人总结

深度学习之YOLO系列（一）

深度学习-物体检测-YOLO系列

深度学习（22）——YOLO系列（1）

深度学习（25）——YOLO系列（4）

深度学习（23）——YOLO系列（2）

深度学习（28）——YOLO系列（7）

深度学习（27）——YOLO系列（6）

深度学习（26）——YOLO系列（5）

深度学习系列7——目标检测 YOLO 系列2

深度学习系列6——目标检测 YOLO 系列1

深度学习目标检测系列之YOLO9000

深度学习与CV教程(13) | 目标检测 (SSD,YOLO系列)

深度剖析YOLO系列的原理

深度学习笔记（十二）YOLO V3 (Tensorflow)

深度学习（目标检测）---YOLO

深度学习笔记（40） YOLO

深度学习_YOLO与SSD(6)

YOLO系列算法学习

深度学习目标检测(object detection)系列（八）YOLO2

深度学习目标检测(object detection)系列（六）YOLO2

深度学习目标检测系列：一文弄懂YOLO算法|附Python源码

深度学习之目标检测系列(四)——YOLO v4剖析及迁移至PaddlePaddle框架

YOLO3 + Python3.6 深度学习篇（中）- Transfer Learning 迁移学习

YOLO3 + Python3.6 深度学习篇（下）- Transfer Learning 迁移学习

DL之Yolo系列：深度学习实现目标检测之Yolo系列的论文简介、概念理解、思路配图等详细攻略

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)