YOLOV1学习总结

企业开发 2023-06-18 21:17:25 阅读次数: 0

文章目录

预测阶段01
预测阶段02-NMS
训练阶段

本文是对【同济子豪兄】对YOLOV1讲解所做得总结

预测阶段01

在这里插入图片描述
输入图像经过卷积神经网络后，输出7x7x30的向量。7x7表示将输入图像分为7x7个grid cell, 每个grid cell生成两个预测框，如下图所示，

在这里插入图片描述

每个预测框包含5个数据：x, y, w, h, c (c表示该框预测到物体的概率)，预测框的边缘线越粗，其c值就越大。
由于使用的是Pascal VOC 数据集，共20个预测类别，所以每个grid cell包含30个数据（2*5 + 20 = 30），20表示该 grid cell 预测结果为某一类别的概率。
下图表示每个grid cell预测的类别，每个grid cell只能预测一个类别。

在这里插入图片描述

预测阶段02-NMS

1.将每个 grid cell 的两个 bbox 预测的20个类别的概率按照下图的方式排列：其中bb1的20个数值表示，该bbox置信度 x 20个预测类别的概率

在这里插入图片描述

假如第一排为dog的预测概率，将其排列如下：

在这里插入图片描述

按照从高到低的顺序排列，从第二个bbox开始，依次拿每个bbox的概率与第一个bbox的概率比较，如果IOU大于阈值，证明这两个bbox预测的为同一个物体，将后面的bbox的预测概率置0。如果IOU小于阈值，则不做改变。再依次和第二个bbox的概率进行比较，如下图所示：

在这里插入图片描述

训练阶段

深度学习（监督学习）的训练，是通过梯度下降和反向传播的方法，迭代地去微调神经元中的权重，来使得损失函数最小化的过程。
如图所示，绿色圆点为ground truth的中心点，其所在的 grid cell 生成的bbox用来预测该ground truth。
1、2号框均为同一个 grid cell 的 bbox, 1号框与 ground truth 的IOU较大，因此由1号框负责拟合该ground truth, 损失函数的设计目的就是尽可能让1号框与3号框一致。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_38584764/article/details/125358518

YOLOV1学习总结

yolov1总结

yolov1 论文学习总结

YOLOV1要点总结

YOLOv1——学习笔记

YOLOv1学习笔记

对于YOLOV1的学习

YOLOv1 学习笔记

目标检测学习--YoLov1

YOLOv1 待续

YOLOv1

YOLOV1原理

yolov1详解

深度学习之---yolov1,yolov2

目标检测YOLOv1、v2、v3学习总结

Object Detection网络框架学习:YOLOV1

深度学习目标检测系列之YOLOV1

论文总结：YOLOv1 , YOLOv2 and YOLOv3

论文阅读: YOLOv1

yolov1阅读笔记

yolov1详细讲解

YOLOV1论文整理

YOLOv1 沉思录

YOLOV1论文精读

YOLOv1目标检测算法详细总结分析（one-stage)(深度学习)(CVPR 2016)

深度学习之---yolov1,yolov2,yolov3

学习：从YOLOv1到YOLOv3，目标检测的进化之路

YOLOv1论文理解

YOLOv1的原理及实现过程

YOLOv1笔记

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)