【论文阅读笔记】YOLO v1——You Only Look Once: Unified, Real-Time Object Detection

其他 2020-03-11 19:25:02 阅读次数: 0

You Only Look Once: Unified, Real-Time Object Detection

（一）论文地址：
（二）核心思想：
（三）网络结构：
（四）Unified Detection：
（五）实验细节：

5.1 激活函数：
5.2 坐标归一化：
5.3 Loss 函数：
5.4 训练细节：

（六）实验结果：

（一）论文地址：

https://arxiv.org/pdf/1506.02640.pdf

（二）核心思想：

YOLO v1 的提出基本是 one-stage 方法的里程碑，作者使用了全局全连接的方法，将目标检测问题重新定义成了一个回归问题，并使得每个预测框都具有全局信息，实现了真正端到端的训练；

并且实验结果也非常出色，不仅比 R-CNN 和 DPM 更快（45 FPS），而且准确率也有了很大的提升；而且一个更小的网络 Fast YOLO，在准确率不受很大影响的情况下，速度达到了 155 FPS；
在这里插入图片描述

（三）网络结构：

在这里插入图片描述

YOLO 的 backbone 依然采用了分类网络，但最后两层使用了全卷积层，最终输出一个 7×7×30 的特征层，其中每个点由于是全连接输出，都考虑了全局的特征信息；

（注意由于使用了全卷积，图像必须是统一448×448大小）

（四）Unified Detection：

在这里插入图片描述
这里是 YOLO 的点睛之笔；

YOLO 为了实现端到端（end-to-end）的训练，不再采用预选框（anchor 或者 default box），而是直接将图像划分成 $S×S$ 个网格区域（文中 $S=7$ ）；

每个区域预测的值为：

该区域覆盖的相应物体的 $B$ 个坐标框的 $4$ 个值（文中 $B=2）$ ，分别为 $\lbrace x,y,w,h \rbrace$ ，同时输出这 $B$ 个预测框的置信度 $p_b$ ，选取置信度最高的那个预测框作为最终的结果；
该区域覆盖物体的分类置信度 $C$ ，其中在 VOC 数据集中 $C$ 是长度为 $20$ 的分类向量；

只有物体的真值框中心落入相应的区域，该区域才被标注为正样本，其置信度定义为：
在这里插入图片描述
即相应物体预测框与真值框的交并比（IOU）；

因此每个区域生成 $B×(4+1)+C=30$ 个预测值，最后全连接层的输出大小为 $S×S×30$ ；

这里使用 $B$ 个预测 box 并生成置信度，是为了提高预测结果的容错率；增大 $B$ 可以提高模型的鲁棒性，但相应的全连接层的计算复杂度也会大大提高；

（五）实验细节：

5.1 激活函数：

激活函数使用了 Leaky ReLU：
在这里插入图片描述

5.2 坐标归一化：

将预测的坐标值 $\lbrace x_p,y_p,w_p,h_p \rbrace$ 归一化为：

$x_p=(x-x_b)/L,y_p=(y-y_b)/L$

$w_p=w/W,h_p=h/W$

其中：

$x,y,w,h$ 是真值框的坐标；
$x_b,y_b$ 为对应区域的中心坐标；
$W$ 是图像边长，文中 $W=448$ ；
$L$ 为步长，即 $L=W/S$ ；

5.3 Loss 函数：

Loss 函数使用了均方差损失函数；

同时为了调节正负样本不均衡问题，引入了两个权重参数：

$\lambda_{coord}=5$ ，表示正样本的坐标回归权重；
$\lambda_{noobj}=0.5$ ，表示负样本的置信度权重；

负样本的预测坐标和类别向量不参与训练；

最终 Loss 定义如下：
在这里插入图片描述

5.4 训练细节：

$batch_size=64$

$momentum=0.9$

$weight$ $decay=0.0005$

$learning$ $rate$ 从 $10^{-3}$ 先升到 $10^{-2}$ 再降到 $10^{-4}$ ；

$drop$ $rate=0.5$

（六）实验结果：

在这里插入图片描述

（作者挑的图好奇怪，，，）

发布了100 篇原创文章 · 获赞 142 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_44936889/article/details/104384273

【论文阅读笔记】YOLO v1——You Only Look Once: Unified, Real-Time Object Detection

YOLO_v1论文详解You Only Look Once,Unified, Real-Time Object Detection

You Only Look Once: Unified, Real-Time Object Detection

You Only Look Once Unified, Real-Time Object Detection

You Only Look Once: Unified,Real-Time Object Detection

论文阅读笔记：You Only Look Once: Unified, Real-Time Object Detection

YOLOv1(You Only Look Once: Unified, Real-Time Object Detection)阅读笔记

You Only Look Once: Unified, Real-Time Object Detection （YOLO 论文翻译）

You Only Look Once: Unified, Real-Time Object Detection（YOLO论文中英同步翻译）

[YOLO]《You Only Look Once: Unified, Real-Time Object Detection》笔记

You Only Look Once: Unified, Real-Time Object Detection 论文阅读

You Only Look Once: Unified, Real-Time Object Detection - 1 - 论文学习

读论文：（YOLOv1）You Only Look Once:Unified, Real-Time Object Detection

《You Only Look Once: Unified, Real-Time Object Detection》YOLOV1论文解读

论文笔记-You Only Look Once:Unified，Real-Time Object Detection

《You Only Look Once: Unified, Real-Time Object Detection》论文笔记

论文笔记：You Only Look Once: Unified, Real-Time Object Detection

(43)[CVPR16] YOLO(You Only Look Once): Unified, Real-Time Object Detection

YoLo： You Only Look Once: Unified, Real-Time Object Detection译文

《You Only Look Once: Unified, Real-Time Object Detection》论文理解

You Only Look Once: Unified, Real-Time Object Detection 论文详读

【目标检测——YOLO系列】YOLOv1 —《You Only Look Once: Unified, Real-Time Object Detection》

【YOLOv1】《You Only Look Once: Unified, Real-Time Object Detection》

3.2 无proposal检测方法(1): You Only Look Once: Unified, Real-Time Object Detection

目标检测（五）YOLOv1—You Only Look Once:Unified,Real-Time Object Detection

YOLOv1：You Only Look Once: Unified, Real-Time Object Detection

【YOLOv1原文+翻译】You Only Look Once Unified, Real-Time Object Detection

YOLOv1: You Only Look Once: Unified, Real-Time Object Detection

【论文阅读笔记】You Only Look Once: Unified，Real-Time Object Dection

【笔记】文献阅读[YOLOV1]-You_only_look_once_Unified_real-time_object_detection

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)