SIFT特征描述详解

SIFT特征描述详解

前言

SIFT的特征描述是将特征点取整之后,周围4×4的小正方形窗口范围内在8个梯度方向的幅值的统计值。共16个正方形窗口,每个正方形窗口统计8个方向i.e(0,45,90,135..270,315)的梯度值。共128维的特征向量,即为该点的特征描述子。

关键点

旋转(坐标变换)

为了保证描述子的旋转不变性(所有特征描述要在同一角度下统计),描述子统计的是纹理(图像)旋转到0度之后的特征向量,所以需要根据特征点的方向对图像进行旋转。

描述子特征向量

这里写图片描述
如果所示黑框即为4×4的正方形。黑框的中心即为特征点的位置。统计16个小黑框内所有像素的梯度值投影到8个梯度方向的值,其总和即为描述子的128维特征向量。
在sift描述子中,统计一个小正方形黑框内的像素的梯度值,并不是计算落在次方形中的像素的梯度方向和幅值,将它们等权的累加起来。而是计算每个小正方形内每个像素值对该正方形中心的“贡献”和。即每个像素不是等权计算的,而是根据其距离小正方形中心的位置加权的得到的。
为了方便计算每个像素到小正方性中心的相对位置,以红色坐标轴建立坐标系,所有的像素点坐标就很容易的表达它们和黑色正方体中心的关系了。

插值(贡献)

原图像进行旋转变换后,像素值会落到4×4的正方形(正方形半径为3sigma)的坐标系下,像素一定会落在某个正方形内,但它们的梯度不是等权计算的,要将他们的梯度值“投影”到小黑正方形的中心线上。其投影的方式是计算像素点的坐标,到周围四个小红点的体积的倒数。累加所有经旋转后的像素值的贡献值,即可得到最终的描述子。


如本篇理解有困难,可以先看,
https://download.csdn.net/download/yz960611/9515718中关于描述子的部分

猜你喜欢

转载自blog.csdn.net/fb_help/article/details/81218413