SURF简介

1、HOG特征简介

目前基于机器学习方法的行人检测的主流特征描述子之一是HOG(Histogram of Oriented Gradient,方向梯度直方图)。HOG特征是用于目标检测的特征描述子,通过计算和统计图像局部区域的梯度方向直方图来构成特征,用这些特征来描述图像。

该方法和边缘方向直方图、scale-invariant feature transform类似,不同的是hog的计算基于一致空间的密度矩阵来提高准确率。Navneet Dalal and Bill Triggs首先在05年的CVPR中提出HOG,用于静态图像or视频的行人检测。

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的描述子。通过计算和统计局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。现如今如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。

2、HOG特征原理

主要思想:

在一幅图像中,局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。其本质是梯度的统计信息,而梯度主要存在于边缘所在的地方。

核心方法:

HOG的核心方法是所检测的局部物体外形能够被光强梯度或边缘方向的分布所描述,通过将图像分割成小的连接区域(称为cells),每个cell生成一个方向梯度直方图或cell中pixel的边缘图像,这些直方图的组合可表示出所检测目标的目标描述子。

为了改善准确率,局部直方图可以通过计算图像中一个较大区域(称为block)的光强作为measure被对比标准化,然后用这个值(measure)归一化这个block中所有的cells,这个归一化过程完成了更好的光照 / 阴影不变性。

HOG的特点:与其他描述子相比,HOG得到的描述子保持了几何和光学转化不变性(除非物体方向改变),因此HOG描述子尤其适合于人的检测。

HOG特征提取主要步骤:

  1. 将一个image灰度化,也就是将图像看成一个x,y,z,的三维图像,其中z为灰度值。
  2. 划分为小的连通区域,称为细胞单元cells(2x2)
  3. 计算每个cells中每个像素点的梯度或边缘的方向直方图
  4. 统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的特征描述器 descriptor。

3、算法优点:

  • 首先,由于HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。

  • 其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。因此HOG特征是特别适合于做图像中的人体检测的。

4、HOG/SIFT/PCA-SIFT的区别与应用

HOG特征没有旋转和尺度不变性,因此计算量小

SIFT中每个feature需要用128维的向量来描述,因此计算量相对很大

SIFT由于其庞大的计算量不能用于行人检测,而PCA-SIFT的方法过滤掉很多维度的信息,只保留20个主分量,因此只适用于行为变化不大的物体检测。

这里写图片描述

行人检测如何使用HOG:

  • 解决scale-invariant:将图像进行不同尺度的缩放,就相当于对模板进行不同尺度scale的缩放
  • 解决Rotation-invariant:建立不同方向的模板进行匹配,一般取15x7大小的

总的来说,就是在不同尺度上的图像进行不同方向的模板匹配,每个点形成一个8方向的梯度描述。

5、用python+opencv实现HOG特征提取

HOG特征提取算法的整个实现过程大致如下:

  1. 读入所需要的检测目标即输入的image

  2. 将图像进行灰度化(将输入的彩色的图像的r,g,b值通过特定公式转换为灰度值)

  3. 采用Gamma校正法对输入图像进行颜色空间的标准化(归一化)

  4. 计算图像每个像素的梯度(包括大小和方向),捕获轮廓信息

  5. 统计每个cell的梯度直方图(不同梯度的个数),形成每个cell的descriptor

  6. 将每几个cell组成一个block(以3*3为例),一个block内所有cell的特征串联起来得到该block的HOG特征descriptor

  7. 将图像image内所有block的HOG特征descriptor串联起来得到该image(检测目标)的HOG特征descriptor,这就是最终分类的特征向量

HOG参数设置是:2*2细胞/区间、8*8像素/细胞、8个直方图通道,步长为1。

猜你喜欢

转载自blog.csdn.net/jiaoyangwm/article/details/79991915