如何理解目标检测中的SSD

其他 2019-04-14 13:42:22 阅读次数: 0

版权声明：原创博客未经允许请勿转载！ https://blog.csdn.net/holmes_MX/article/details/83186298

0. 写作目的

好记性不如烂笔头。

1. SSD

1.1 网络的框架

下面的第一个4表示的是4个default box（与faster R-CNN 和YOLO不同，这里是中心坐标加上宽高），

其中： classifer是通过3 * 3 * （4 * （classes + 4））的卷积实现的，得到结果即是检测的结果，然后将不同feature map的检测结果放在一起。先过滤掉confidence很低的检测结果，如可以过滤掉confidence 小于0.01。然后对每一类通过NMS。（然后一般保留前200个选择后的检测结果）

图中SSD300的Boxes数目计算方法：

SSD（300*300）中38 * 38 有4个default box， 19 * 19 有6个 defaule box， 10 * 10 有6 个default box， 5 * 5有6个default box， 3 * 3和 1 * 1有4个default box。所以共有： 38 * 38 * 4 + 19 * 19 * 6 + 10 * 10 * 6 + 5 * 5 * 6 + 3 *3 *4 +1*1*4 = 8732个预测结果。

YOLO(VGG16)的boxes数目计算方法（此处为YOLOv1）：

YOLO采用的是7 * 7的feature map和 2个，因此 7 * 7 * 2 = 98个boxes。

1.2 训练匹配策略

由于SSD预测的时候在，class中包含了background类别，因此在训练的时候需要对background类别进行采样。当IOU>0.5的时候为正样本，否则为负样本。但是由于负样本远远多于正样本，如果不采取措施的话，会导致训练不稳定，因此SSD中采样，负样本为正样本的3倍。（注：YOLO中不存在选择背景，faster R-CNN也需要选择background）

如何选择负样本呢？

通过选择loss最高的top负样本。

1.3 default box的选择

如对于需要预测6个结果的cell，选择长宽比为{1， 2, 3, 1/2, 1/3}，然后通过下面公式计算得到w, h。

其中对于长宽比为1时，多选择一次scale。

1.4 Data Augmentation

[Reference]

[1] SSD paper: https://arxiv.org/abs/1512.02325

[2] 理解SSD 英文版: https://medium.com/@jonathan_hui/ssd-object-detection-single-shot-multibox-detector-for-real-time-processing-9bd8deac0e06

[3] 理解SSD 英文版:https://towardsdatascience.com/understanding-ssd-multibox-real-time-object-detection-in-deep-learning-495ef744fab

[4] 理解SSD 英文版: https://medium.com/@smallfishbigsea/understand-ssd-and-implement-your-own-caa3232cd6ad

猜你喜欢

转载自blog.csdn.net/holmes_MX/article/details/83186298

如何理解目标检测中的SSD

目标检测:SSD目标检测中PriorBox代码解读

目标检测—SSD

SSD目标检测

目标检测SSD算法

目标检测（一）—— SSD

目标检测方法——SSD

SSD 目标检测

重温目标检测--SSD

目标检测之SSD

目标检测总结：SSD

目标检测--SSD

【目标检测】SSD：

目标检测 SSD

目标检测：SSD 算法

目标检测之 SSD

MXNet：目标检测与SSD

目标检测SSD

目标检测-＞SSD算法

目标检测之SSD：RefineNet算法理解

【目标检测】OpenCV中dnn模块的SSD demo运行

CNN目标检测：SSD详解

SSD-Tensorflow 目标检测

SSD目标检测原理详解

目标检测算法——SSD

目标检测 [SSD原理与实现]

目标检测系列（七）：SSD

目标检测——SSD的学习笔记

目标检测——SSD模型介绍

目标检测SSD学习笔记

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)