第四门课：卷积神经网络（第三周）——目标检测

编程语言 2022-04-23 03:28:10 阅读次数: 0

目标检测

1. 目标定位
2. 特征点检测
3. 目标检测
4. 滑动窗口的卷积实现
5. Bounding Box预测（YOLO）
6. 交并比（loU）
7. 非极大值抑制（Non-max suppression）
8. Anchor Boxes
9. YOLO 算法
10. 候选区域

1. 目标定位

定位分类问题：
在这里插入图片描述
不仅要判断图片中是不是一辆汽车，还要标记出它的位置，用框圈起来

softmax函数进行分类操作，判断图片中是否存在行人、汽车和摩托车或是背景对象。除此之外，我们可以让神经网络多输出几个单元，表示一个边界框，即 $b_x, b_y, b_h, b_w$ ，这四个数字是被检测对象的边界框的参数化表示。
在这里插入图片描述

2. 特征点检测

Landmark 检测

在这里插入图片描述

3. 目标检测

基于滑动窗口的目标检测

将目标剪切出来，训练卷积网络
以一定大小的窗口扫描图片，将窗口内的图片输入卷积网络预测
更改窗口大小，重复上面步骤

滑动窗口目标检测算法缺点：

计算成本高，用小粒度或小步幅，窗口会特别多，卷积网络要一个个地处理
用的步幅很大，窗口个数少，可能会影响性能

4. 滑动窗口的卷积实现

在这里插入图片描述

对整张图片进行卷积操作，一次得到所有预测值，如果足够幸运，神经网络便可以识别出目标的位置
在这里插入图片描述
在卷积层上应用滑动窗口算法，提高了整个算法的效率
不过这种算法仍然存在一个缺点，就是边界框的位置可能不够准确

5. Bounding Box预测（YOLO）

滑动窗口法中，离散的边界框可能没有一个能完美匹配汽车位置

一个能得到更精准边界框的算法是YOLO算法，YOLO(You only look once)意思是你只看一次，这是由Joseph Redmon，Santosh Divvala，Ross Girshick和Ali Farhadi提出的算法

在这里插入图片描述
YOLO算法有一个好处，它是一个卷积实现，运行速度非常快，可以达到实时识别

边界框定义还有其他更有效的方法，可能效果要更好一点

6. 交并比（loU）

交并比（loU）函数做的是计算两个边界框交集和并集之比。
在这里插入图片描述

7. 非极大值抑制（Non-max suppression）

算法可能对同一个对象做出多次检测。非极大值抑制确保算法对每个对象只检测一次。

非极大值抑制，非最大值意味着你只输出概率最大的分类结果，抑制很接近，但不是最大的其他预测结果
在这里插入图片描述
如果你尝试同时检测三个对象，比如说行人、汽车、摩托，那么输出向量就会有三个额外的分量。
事实证明，正确的做法是独立进行三次非极大值抑制，对每个输出类别都做一次

8. Anchor Boxes

提出anchor box 这个概念主要有两个原因：

一个窗口只能检测一个目标
无法解决多尺度问题

算法处理不好的情况：
如果你有两个anchor box，但同一格子有三个对象
两个对象都分配到一个格子中，且它们的anchor box形状也一样
出现的概率比较小，对性能的影响应该不会很大

怎么选择 anchor box呢？

一般手工指定anchor box形状，选择5到10个anchor box形状，覆盖多种不同的形状
k - 平均算法，可以将两类对象形状聚类，选择最具有代表性的一组 anchor box，这是自动选择anchor box的高级方法

9. YOLO 算法

训练：
预测：
非极大值抑制：
如果使用两个anchor box，那么9个格子中任何一个都会有两个预测的边界框，其中一个的概率很低。
接下来你抛弃概率很低的预测。

如果你希望检测（3种目标）行人，汽车和摩托车，那么你要做的是，对于每个类别单独运行非极大值抑制，运行三次来得到最终的预测结果。

10. 候选区域

在这里插入图片描述

候选区域是一个有趣的想法，但这个方法需要两步：

首先得到候选区域
然后再分类

相比之下，类似于YOLO（You only look once）这个算法，能够一步做完，老师觉得长远而言更有希望
YOLO 网址：https://pjreddie.com/darknet/yolo/

猜你喜欢

转载自blog.csdn.net/qq_42859149/article/details/119915564

第四门课：卷积神经网络（第三周）——目标检测

第四门课-卷积神经网络第三周（重点总结）

吴恩达 -- 第四课卷积神经网络第三周 Detection algorithms

第四门课：卷积神经网络（第二周）——深度卷积网络：实例探究

第四门课-卷积神经网络第四周（重点总结）

深度学习卷积神经网络第四课第三周 Autonomous driving application - Car detection - v1

coursera 吴恩达 -- 第四课卷积神经网络：第三周 Autonomous driving - Car detection

第二门课-改善深层神经网络第三周（重点总结）

第一门课：神经网络和深度学习（第三周）——浅层神经网络

第四门课-卷积神经网络第二周（重点总结）

第四门课-卷积神经网络第一周（重点总结）

第四门课：卷积神经网络（第四周）——特殊应用：人脸识别和神经风格转换

卷积神经网络—第三周

吴恩达【深度学习工程师】 04.卷积神经网络第三周目标检测（1）基本的对象检测算法

吴恩达深度学习第三门课第三周目标检测

吴恩达【深度学习工程师】 04.卷积神经网络第三周目标检测（2）YOLO算法

第一门课-深度学习和神经网络第三周（重点总结）

深度学习：第一门课，神经网络和深度学习：第三周，浅层神经网络

3.3 目标检测-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

卷积神经网络（三）目标检测

吴恩达《深度学习》第四门课（1）卷积神经网络

吴恩达《深度学习》第四门课（2）卷积神经网络：实例探究

Deep Learning.ai学习笔记_第四门课_卷积神经网络

第四门课卷积神经网络（Convolutional Neural Networks）

第三周学习进度--卷积神经网络简单实践

第一门课：神经网络和深度学习（第四周）——深层神经网络

吴恩达深度学习（笔记+作业）·第四课·第三周目标检测（重点解析YOLO算法）

3.2 目标点检测-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

卷积神经网络—第四周

【中文】【吴恩达课后编程作业】Course 4 - 卷积神经网络 - 第三周作业

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)