LBP特征学习（附python实现）

LBP的全称是Local Binary Pattern即局部二值模式，是局部信息提取中的一种方法，它具有旋转不变性和灰度不变性等显著的优点。在人脸识别领域有很多案例，此外，局部特征的算法还有 SIFT HOG等等。

LBP就是一种局部信息，它反应的内容是每个像素与周围像素的关系。举最基本的LBP为例，它反应了像素与周围8个点灰度值的关系，如下图所示：

　　如上图所示，中间像素的灰度值为54，我们如下定义：当周围像素的灰度值大于等于中间像素值时，则LBP的一位值为1，否则为零。由这个九宫格，我们就得到了8位二进制数，顺时针取值，就得到了一个像素的LBP值，即11010011。那么我们如何表示这个二进值数呢，很简单，我们将它转化为十进制数即可，也就是211，即这一点的LBP值为211。就这样对整个图像进行LBP运算，就可以得到这幅图像的LBP特征。也就是说，我们把一张像素为256*256的图片进行LBP特征提取，我们就可以得到一个256*256的特征图（最外面的一圈进行补0后在进行运算），但每个特征图里的数值的范围是多少呢 0-256吗不是的，特征图里的数值是由你定义的半径和邻居数决定的 。比如上述的例子，他的半径是只选了周围一圈的8个，也就是半径为1，邻居为 8 （一般来说，邻居数为半径的8倍）。以此类推。如果我们定义的是半径为2 ，邻居为 2*8时得到的特征图的数值的二进制数长度就翻了一番，所以范围是 0-65535 。

　　但是得到这些特征有什么作用呢？提取图像特征的目标无非就是为了进行分类，我们把一幅灰度图像转化为了LBP特征图像，从理论上讲并没有实现降维，也无法进行分类。

　　这时就引入了直方图统计，我们将LBP特征进行直方图统计，也就是统计LBP特征0~255各占的比例，这样就进行了数据的降维。之后就可以将一个向量输入分类器中进行分类。可是由于只有256维特征，所以分类的效果并不好。这时我们就引入了图像分块处理的方法，也就是说将图像分成若干的图像块，如，在人脸识别中，把脸分为7*7，5*5的区域，并对这49，25个小区域进行LBP处理，将每个小区域的直方图进行串联，就可以得到整个图像的LBP直方图。并对这个直方图进行分类处理，这样可以大大的增强分类的效果。但是分类数据维度也大大增加了，如果是7*7区域，数据维度为7*7*256＝12544维。

可以看出数据的维度还是比较大，所以需要进一步进行降维，这里就涉及了另外一个概念：Uniform LBP，即均匀模式LBP。这种降维感觉是用了电路中的方法，也就是将原来的256维灰度数据重新分类，统计其位移后的跳变次数，当跳变次数小于2次时就定义为一个Uniform LBP，比如00000000左移一位还是00000000，没有跳变，即跳变次数为0；00001111左移一位为00011110，跳变次数为2；10100000左移一位为01000001跳变次数为3，它不是Uniform LBP。经过统计，Uniform LBP在整个的LBP特征中占85~90%，而Uniform LBP只有58个特征。所以我们将分类特征向量由256维降为58维。在实际应用中，其实是59维，因为加一维表示那些不是Uniform LBP的量。那么7*7的人脸区域在进行降维之后，有7*7*59＝2891维。由此对LBP特征进行了降维。

所以，对LBP特征向量进行提取的步骤为：

1）首先将检测窗口划分为16*16的小区域（cell）

2）对于每个cell中的一个像素，将相邻的8个像素的灰度值与其进行比较，若周围像素值大于中心像素值，则该像素点的位置被标记为1，否则为0.这样，3*3领域内的8个点经过比较可产生8位二进制数，即得到该窗口中心像素点的LBP值；

3）然后计算每个cell的直方图，即每个数字出现的频率，然后对该直方图进行归一化处理

4）最后将得到的每个cell的统计直方图进行连接成一个特征向量，也就是整幅图的LBP纹理特征向量

然后便可以用SVM或者其他机器学习算法进行分类了。

此外，LBP有许多的改进版本

1）圆形LBP算子

基本的LBP算子的最大缺陷就是只覆盖了一个固定半径范围内的小区域，这显然不能满足不同尺寸和频率纹理的需要，为了适应不同尺度的纹理特征，并达到灰度和旋转不变性的要求。改进后的LBP算子允许在半径为R的圆形领域内有任意多个像素点，从而得到诸如半径为R的圆形区域内含有p个采样点的LBP算子（见LBP算子.jpg）

2）LBP旋转不变模式

从LBP定义可以看出，LBP算子是灰度不变的，但却不是旋转不变的，图像的旋转就会得到不同的LBP值。为了得到旋转不变性，即不断旋转圆形领域得到一系列初始定义的LBP值，取其最小值作为该领域的LBP值。（见旋转不变的LBP示意.jpg）

3）LBP等价模式

一个LBP算子可以产生不同的二进制模式，对于半径为R的圆形区域内含有p个采样点的LBP算子将会产生2的p次方中模式，显然，随着领域内采样点数的增加，二进制模式的种类急剧增加。如此多的二值模式对于纹理的表达是不利的。如将LBP算子用于纹理分类或人脸识别时，常采用LBP模式的统计直方图来表达图像的信息，而较多的模式种类将使得数据量过大，且直方图过于稀疏，因此，需要对原始的LBP模式进行降维，使得数据减少的情况下能最好的代表图像的信息。

使用python进行LBP特征提取并进行SVM训练

使用到 skimage sklearn 等等

代码稍后写好放上去。。。。

参考文献： http://blog.sina.com.cn/s/blog_4bdbec750101ekuh.html

　　　　https://1043693084-qq-com.iteye.com/blog/2245828

LBP特征学习（附python实现）

猜你喜欢