【AI】《动手学-深度学习-PyTorch版》笔记(二十一):目标检测

AI学习目录汇总

1、简述

通过前面的学习,已经了解了图像分类模型的原理及实现。图像分类是假定图像中只有一个目标,算法上是对整个图像做的分类。
下面我们来学习“目标检测”,即从一张图像中找出需要的目标,并标记出位置。

2、边界框

边界框:bounding box,就是一个方框,使用方框将目标刚刚好的框起来。
用坐标来表示边界框的位置和大小有两种方式

  • 边界框左上角、右下角的坐标表示
  • 边界框中心的坐标和框的宽高表示。

3、锚框

锚框:anchor box,想像一下,其实我们不知道目标大小和位置,先假定目标的中心位置,和船下锚类似,然后使用多个不同大小的框来探测是否有被测目标。
不同大小的框可以通过不同的缩放比和宽高比来表示。
除了使用坐标来描述锚框的大小和位置,还需要一个标签来标记被检测目标的类别。
在这里插入图片描述

4、交并比

交并比:IoU,用来衡量锚框和真实边界框之间的相似性,杰卡德系数,数学公式如下:

猜你喜欢

转载自blog.csdn.net/u010168781/article/details/132567611