吴恩达深度学习（笔记+作业）·第四课·第三周目标检测（重点解析YOLO算法）

其他 2021-11-28 01:51:27 阅读次数: 0

目录

一、目标定位

二、特征点检测（另一种思路）

三、目标检测算法 object detection algorithm

四、卷积的滑动窗口实现

五、Bounding Box预测（YOLO算法的精髓）

六、交并比 IOU

七、非极大值抑制 non-max suppression

八、锚框 Anchor Boxes

九、YOLO算法

十、候选区域 Region proposals

一、目标定位

二、特征点检测（另一种思路）

标签特征点的顺序，在所有的样本数据集当中都必须一致

三、目标检测算法 object detection algorithm

滑动窗口的目标检测算法 the sliding windows detection algorithm

标签数据集：照一张照片，然后剪切，剪掉目标以外的部分，使目标居于中心位置，并基本占据整张图片，将标签设置为0/1

然后找一些同样处理过的图片，通过CNN进行训练，训练完毕之后，就可以通过滑动窗口目标检测算法

由于之前已经对卷积神经网络已经训练好了，这个时候取一个窗口，开始在所检测的图片上进行滑动，将图片上的这一窗口的图片传入训练好的CNN当中，预测判断整个窗口里有无目标，然后依次重复操作，直到划过窗口的每一个角落

调整滑动的速度，可以设置固定步幅进行遍历

但是有很明显的缺点：计算成本

在神经网络兴起之前，大家有用的都是比较简单的线性分类器，计算成本比较小，最后的效果也比较好，但是卷积神经网络的加入，倒是运行单个分类任务的成本高很多

四、卷积的滑动窗口实现

缺点：边界框的位置可能不太精确

五、Bounding Box预测（YOLO算法的精髓）

YOLO算法基本原理是，将图片划分为网格（这里以3×3为例），使用图像分类和定位算法，然后将算法应用到9个格子上，那么如何定义训练标签呢？

就以第一块中讲的那个例子来说，对于每一个网格指定一个标签y，y是8维向量，那么y=（pc，bx，by，bh，bw，c1，c2，c3），这里一共有9个格子，那么就有9个这样的标签向量。

如果遇到所检测的目标占据了多个格子，那么就找到目标的中心点（目标的中心点就是bx-by），看看这个中心点落在哪一个格子里，那么这个目标就是属于哪一个格子，所以即便一个对象横跨多个方格，最后也只会被分配到9个格子中的一个！所以9个格子中的任意一个格子都会得到8维输出向量，那么对于3×3的格子而言，就会得到目标输出3×3×8

在训练的时候，假设输入100×100×3的图像，那么就将图片通过CNN转化为3×3×8的输出，同3×3×8的标签进行计算损失

那么如果一个格子中有两个目标的中心点怎么办？在实际情况中，我们会将格子划分成19×19（或其他），这样两个中心点分配到一个格子的概率就小得多

对于这个算法而言，可以得到比较精确的框，同时，是对整个图像进行单次卷积，共享了很多数据，降低了计算成本，所以算法的效率很高，运行速度很快，可以达到实时识别

六、交并比 IOU

如何表现算法检测精度的效果好坏呢——交并比

七、非极大值抑制 non-max suppression

你的算法可能对同一个对象做出多次检测，非极大值抑制可以确保，你的算法对每个对象只检测一次，非极大值抑制意味着你只输出概率最大的分类结果

首先找到图中概率最大的一个矩形框，然后将整个矩形框保留下来，找到和整个矩形框交并比的其他几个矩形框，然后将其抑制，这样，一个对象就只会留下一个概率最大的矩形框，然后找到图片中第二高的概率（第二个对象），同上面的做法进行非极大值抑制

最后得到两个框！

八、锚框 Anchor Boxes

到目前为止，每个格子只能检测出一个对象，那么锚框可以做到一个格子检测到多个对象

我们一般手动给定5个到10个anchor box形状，覆盖不同的形状

九、YOLO算法

十、候选区域 Region proposals

用图像分割算法，找到可能存在对象的区域，进行窗口检测

大家可以看看这边的作业：

【中文】【吴恩达课后编程作业】Course 4 - 卷积神经网络 - 第三周作业 - 车辆识别

另外我会在实战中用pytorch来操作

猜你喜欢

转载自blog.csdn.net/weixin_44917390/article/details/119912106

吴恩达深度学习（笔记+作业）·第四课·第三周目标检测（重点解析YOLO算法）

吴恩达深度学习第四课第三周作业中缺少的yolo.h5文件

吴恩达第四课第三周车辆检测yolo.h5加载失败解决办法

吴恩达深度学习第三门课第三周目标检测

3.9 YOLO算法-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

3.3 目标检测-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

吴恩达《深度学习》第四课第三周

3.1 目标定位-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

1.2 边缘检测示例-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

吴恩达第四课第三周编程作业

3.2 目标点检测-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

1.3 更多边缘检测内容-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

deep learming 吴恩达第四课第三周 Detection algorithms

吴恩达第四课第三周分析

吴恩达【深度学习工程师】 04.卷积神经网络第三周目标检测（2）YOLO算法

吴恩达深度学习（笔记+作业）·第四课·第二周深度卷积网络实例

吴恩达 -- 第四课卷积神经网络第三周 Detection algorithms

《深度学习——Andrew Ng》第四课第三周编程作业

吴恩达【深度学习工程师】 04.卷积神经网络第三周目标检测（1）基本的对象检测算法

吴恩达《深度学习》第四课第四周

吴恩达《深度学习》第四课第二周

吴恩达《深度学习》第四门课（3）目标检测（Object detection）

吴恩达深度学习（笔记+作业）·第四课·第一周卷积神经网络

吴恩达-AI-机器学习课后习题解析-第三周

coursera 吴恩达 -- 第四课卷积神经网络：第三周 Autonomous driving - Car detection

deep learming 吴恩达第四课第三周编程 Autonomous driving application - Car detection - v3

吴恩达深度学习（笔记+作业）·第二课·第二周优化算法（快速训练模型）

深度学习第四课第三周

吴恩达深度学习第四课第四周人脸识别和神经风格转换

Ng深度学习课程-第四课第三周笔记摘要

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)