目标检测之YOLOv1算法分析 - 代码天地

目标检测之YOLOv1算法分析

企业开发 2023-10-05 09:53:50 阅读次数: 0

网络结构

卷积层+池化层+全连接层
在这里插入图片描述

输入 $448 * 448$ 大小的图片
输出 $7 * 7 * 30$ 的张量

30维张量包括20个对象的概率，2个bounding box的置信度及其位置（一个bounding box位置信息需要四个值，两个bounding box总需要8个值）

20个对象的概率即为条件概率，如果该网格中存在一个检测对象，那么该检测对象为类别A的概率： $p(P_A|exist\_objects)$

2个bounding box的置信度，其中置信度=p(exist_objects) * 该预测的bounding box与该对象的真实边框的IOU值

两个bounding box的置信度分别于20个类别的概率相乘，可得到分在在两个bounding box中的每一类的概率。

重点分析

bounding box相关内容

每一个网格给出两个bounding box信息，但一个对象只需要一个bounding box。为此，通过一定的个标准进行舍取。
输出的30维向量中，包含两个bounding box的置信度，该置信度反应出预测框与真实框IOU交并比。那么两个框IOU交并比，谁大就由谁负责预测一个对象，并且 $p(exist\_objects)$ 为1，另一个bounding box的 $p(exist\_objects)$ 为0。那么根据公式可知置信度其实就为IOU交并比值。

grid cell 与 bounding box

将图片分成 $7 * 7$ 的网格（grid cell）,每一个grid cell生成两个预测框bounding box，该预测框的中心点都落在该grid cell格子内部。每一个grid cell只能预测一个物体。

损失函数

在这里插入图片描述

公式分析，其中 $1_i^{obj}$ 表示网格 $i$ 存在检测对象， $1_{ij}^{obj}$ 表示网格 $i$ 的第 $j$ 个bounding box存在检测对象， $1_{ij}^{nobj}$ 表示网格 $i$ 的第 $j$ 个bounding box不存在检测对象

第一行表示边框中心点的误差，grid cell中负责预测的bounding box框与真实框的误差

第二行表示预测框相对于真实框的宽和高的误差。其中开方旨在降低因为大小不同带来的敏感问题

第三行表示置信度误差，即边框内存在对象， $\bar{C_i}$ 越高越好

第四行也表示置信度误差，即边框内不存在对象， $\bar{C_i}$ 越低越好

最后一行表示对象分类误差

猜你喜欢

转载自blog.csdn.net/qq_44116998/article/details/128428200

目标检测之YOLOv1算法分析

目标检测之单阶段算法--YOLOv1详解

目标检测之YOLOv1

目标检测（五）之YOLOv1

目标检测算法YOLOv1原理与实现

YOLO系列目标检测算法-YOLOv1

目标检测YOLO算法，先从yolov1开始

深度学习目标检测系列之YOLOV1

目标检测之YOLOv1源码解析

目标检测之深入理解YOLOv1

【目标检测】YOLOV1详解

【目标检测系列】YOLOV1解读

目标检测学习--YoLov1

YOLOv1目标检测算法详细总结分析（one-stage)(深度学习)(CVPR 2016)

浅析目标检测入门算法：YOLOv1,SSD,YOLOv2,YOLOv3,CenterNet,EfficientDet,YOLOv4

目标检测 | 让YOLOv1算法告诉你回归网络的能力

【模型训练】目标检测实现分享一：详解 YOLOv1 算法实现

目标检测系列—深度解读 YOLOv1 (1)

【YOLO系列】YoloV1目标检测模型

目标检测-yolov1的详细理解（代码和原理）

【目标检测】YOLO系列——YOLOv1详解

【目标检测】(5) YOLOV1 目标检测原理解析

目标检测之YOLOv5算法分析

目标检测之YOLOv4算法分析

目标检测之YOLOv3算法分析

目标检测之YOLOv2算法分析

从YOLOv1到YOLOv3，目标检测的进化之路

学习：从YOLOv1到YOLOv3，目标检测的进化之路

目标检测YOLO系列算法精讲：从yolov1至yolov4的进阶之路（呕心沥血2万字超全整理，建议收藏！）

【目标检测】阅读YOLOv1 论文的一些feelings

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)