FoveaBox: Beyond Anchor-based Object Detector解读 (二)

二、相关工作

        传统目标探测器 : 之前成功的深度卷积神经网络,广泛使用的检测系统是基于独立组件的(HOG,SIFT)。DPM和它的变体帮助对象检测延伸到更一般的类别检测,并且多年一直有领先的成绩。滑动窗口方法对于在传统的目标检测框架中搜索感兴趣的对象是一种领先的范例。

     现代目标探测器:现代目标 的探测器主要分为两类:两阶段:建议驱动探测器 和 单阶段:无建议的方法。对于两阶段的探测器,第一阶段生成一系列稀疏的对象建议区和第二阶段是对建议进行分类以及改善滑动窗口方式相对应的坐标位置。这种途径被解释有效性是通过R-CNN,这种方式被广泛应用在之后两阶段的方法中。在Faster R-CNN ,第一阶段(RPN)同时使用轻量级 的网络预测每个预定义滑动窗锚盒的对象边界和对象得分。尝试多次去提供探测器的性能,包括特征金字塔,多尺寸和对象间的关系。

      与两阶段方法相比,一阶段方法跳过对象建议生,以及在评估中 预测边界框和类别得分。大多数顶级的单步探测器依靠锚盒去计算目标对象可能存在的位置((e.g. SSD , DSSD , YOLOv2/v3 , and RetinaNet )。在CornerNet中作者建议将对象边界作为关键点。CornerNet采用 Associative Embedding技术去分离不同的实例。以前的工作与我们的相似之处,将会在后面去讨论。

 补充解释:.

HOG: Histograms of oriented gradients for  human detection

.      HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子,是与SIFT、SURF、ORB属于同一类型的描述符。HOG不是基于颜色值而是基于梯度来计算直方图的,它通过计算和统计图像局部区域的梯度方向直方图来构建特征。HOG特征结合SVM分类器已经被广泛应用到图像识别中,尤其在行人检测中获得了极大的成功。

     1.  主要思想:((本质:梯度的统计信息,梯度主要存在于边缘的地方))

        局部目标的外表和形状可以被局部梯度或边缘方向的分布很好的描述,即使我们不知道对应的梯度和边缘的位置。

     2.  实施方法:

        首先将图像分成很多小的连通区域,我们把它叫做细胞单元,然后采集细胞单元中各像素点的梯度和边缘方向,然后在每个细胞单元中累加出一个一维的梯度方向直方图。

        为了对光照和阴影有更好的不变性,需要对直方图进行对比度归一化,这可以通过把这些直方图在图像的更大的范围内(我们把它叫做区间或者block)进行对比度归一化。

        首先我们计算出各直方图在这个区间中的密度,然后根据这个密度对区间中的各个细胞单元做归一化。我们把归一化的块描述符叫作HOG描述子。

    3.   目标检测

          将检测窗口中的所有块的HOG描述子组合起来就形成了最终的特征向量,然后使用SVM分类器进行行人检测。

          下图描述了特征提取和目标检测流程。检测窗口划分为重叠的块,对这些块计算HOG描述子,形成的特征向量放到线性SVM中进行目标/非目标的二分类。检测窗口在整个图像的所有位置和尺度上进行扫描,并对输出的金字塔进行非极大值抑制来检测目标。(检测窗口的大小一般为128×64128×64)          

       SIFT:  参照  paper:Distinctive image features from scaleinvariant  keypoints.

猜你喜欢

转载自blog.csdn.net/fg13821267836/article/details/90737334