YOLO v3 检测原理 - 代码天地

YOLO v3 检测原理

其他 2018-10-23 08:15:09 阅读次数: 0

版权声明：本文为博主原创文章，转载请注明出处。 https://blog.csdn.net/dcrmg/article/details/81874147

YOLO v3文章地址：YOLOv3: An Incremental Improvement

v3相对于v2的主要改进：

1. 特征提取器更深（参考ResNet）
2. 多尺度预测（类似FPN）
3. Bounding Box和Loss

1. 特征提取器（分类器）

V3的特征提取器在V2的Darknet-19基础上做了优化，命名为Darknet-53。包含52层卷积层和1个全连接层，加入了多个连续的3×3和1×1的卷积，借鉴了ResNet网络结构，增加直接连接（shortcut connections），并且网络层数达到53层，简易框架：

Darknet53和Darknet19、ResNet在ImageNet上的效果对比：

2. 多尺度预测

在结果的预测上，v2只用了一个尺度，v3使用了3个尺度。分别是一个下采样的，feature map为13*13，还有2个上采样的eltwise sum，feature map为26*26，52*52，也就是说v3的416版本已经用到了52的feature map，而v2把多尺度考虑到训练的data采样上，最后也只是用到了13的feature map，这应该是对小目标影响最大的地方。
每个位置预测3个bbox(4个位置输出+1个objectness+C个类别的分数)，在v2中会预测5个bbox。所以每个位置输出(1+4+C)*3个值，这也就是训练时yolov3.cfg里的filter的数量。这也就是每个尺度张量的深度。

3. Bounding Box的预测和Loss

边界框的预测跟V2中一样，仍使用维度聚类方法，先在样本上使用K-means聚类得到Anchor Boxes（v2中使用了5个，v3中使用了9个）。使用逻辑回归而不是Softmax对每个框进行分类，这是考虑到自然场景图像中物体之间重叠很常见，使用Softmax在每一个框上只能给出最大的类别，导致重叠的漏检，使用多个单独的逻辑回归（主要用到了sigmoid函数）预测替代了之前的Softmax分类。

猜你喜欢

转载自blog.csdn.net/dcrmg/article/details/81874147

YOLO v3 检测原理

yolo v3原理

重温目标检测--YOLO v3

目标检测(8)-Yolo v3

『目标检测』YOLO V3

目标检测之YOLO V2 V3

目标检测 YOLO v3 训练人脸检测模型

YOLO v3 检测算法实践

目标检测 YOLO v3 验证 COCO 模型

目标检测系列（九）：YOLO v3

目标检测论文解读8——YOLO v3

目标检测（七）之YOLO v3

Yolo v3目标检测模型代码使用

使用Yolo v3进行目标检测

yolo目标检测系列--综述--v3

Tensorflow目标检测-Yolo v3模型学习

YOLO v3

Yolo v3图像目标检测学习 + 实践笔记 (一) 原理和网络结构

【目标检测 Object Detection】从YOLO v1 到 YOLO v3 算法总结

理解 YOLO 目标检测网络之 YOLOv3 yolo类检测算法解析——yolo v3

YOLO 总结汇总 yolo v2记录 yolo类检测算法解析——yolo v3 目标检测网络之 YOLOv3

Yolo v3 详解

YOLO V3 (一)

深入理解目标检测与YOLO（从v1到v3）

目标检测：YOLO(v1 to v3)——学习笔记

YOLO-V1~V3经典物体检测算法介绍

目标检测算法——YOLO[v1~v3]

【YOLO】yolo v1到yolo v3

TensorFlow + Keras 实战 YOLO v3 目标检测图文并茂教程

从零开始PyTorch项目：YOLO v3目标检测实现

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)