零基础入门目标检测系列学习记录(一):先验知识

百度飞桨零基础实践深度学习目标检测系列学习笔记
目标检测任务目的: 所属类别 + 目标位置
面对的核心问题:
1.如何产生候选区域 2.如何提取图像特征
在这里插入图片描述

目标检测发展进程:

当前主要为两个方向:

(1):Anchor-Free

一种是基于中心点的方法,另一种是基于边界框的方法。
1.基于中心点的方法通常将每个像素点视为目标中心点的可能性,并在此基础上预测目标的大小和类别。
2.基于边界框的方法则直接从特征图中预测目标的边界框,而不需要预定义的锚框。

(2):Anchor-Based

在预测目标位置和大小时使用预定义的锚框(Anchor Box)或先验框(Prior Box)。

在这里插入图片描述
在这里插入图片描述

目标检测基础知识:

(1)边界框bbox

bbox用于标识出图像中的目标物体,并且通常与目标的类别一起表示。模型会根据输入的图像和bbox来预测目标的类别和位置,并输出相应的检测结果。
在这里插入图片描述

(2)锚框AnchorBox

锚框(Anchor Box),也称为先验框(Prior Box),是一种在目标检测中用于生成候选框的技术。锚框是一组预定义的框,每个框具有不同的尺寸和长宽比,用于尝试匹配输入图像中的不同目标。锚框通常是在输入图像的每个位置生成的,以尝试捕获不同尺度和长宽比的目标。
在目标检测的训练过程中,模型会根据预定义的锚框和实际目标的位置和大小进行训练,以学习如何预测目标的类别和位置。在推理过程中,模型会根据预测结果和锚框的位置和大小来确定目标的位置和大小。
在这里插入图片描述

(3)交并比IOU

交并比(Intersection over Union,IoU)是一种用于评估目标检测算法性能的指标。在目标检测中,IoU通常用于衡量模型预测的边界框(bbox)与实际目标边界框的重叠程度。

IoU的计算公式为:IoU=交集面积/并集面积
其中,交集面积是指模型预测的bbox和实际目标bbox之间的重叠部分面积,而并集面积是指两个bbox的面积加上它们的重叠部分面积。
通常情况下,IoU的阈值会根据具体的任务和需求进行设置,例如在目标检测中,通常将IoU阈值设置为0.5或0.7,以判断模型是否成功检测到目标。 除了用于评估模型性能外,IoU还可以用于一些目标检测算法中的bbox优化和调整,例如非极大值抑制(NMS)算法就是基于IoU的。
在这里插入图片描述
在这里插入图片描述

(4)非极大值抑制NMS

如果有多个预测框位置比较接近,只选出得分最高的那个预测框,剩下的预测框被丢弃掉。
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/m0_63495706/article/details/130049529