CVPR读书笔记[4]:Gabor特征提取之Gabor核

CVPR读书笔记[4]:Gabor特征提取之Gabor核

朱金华 [email protected] 2014.08.09

本文是Gabor特征提取三部分之一:

[1]CVPR读书笔记[4]:Gabor特征提取之Gabor核

http://blog.csdn.net/njzhujinhua/article/details/38460861

[2] CVPR读书笔记[5]:Gabor特征提取之Gabor核的实现

http://blog.csdn.net/njzhujinhua/article/details/38610281

[3] CVPR读书笔记[6]:Gabor特征提取

http://blog.csdn.net/njzhujinhua/article/details/38614697

(后注:传图片好麻烦, 几个公式截图在一块了, 除了wiki那个其余的可是我用公式编辑器一个个敲的啊 )

关于Gabor滤波,有的说法是加窗傅里叶变换,有的说法是用复正弦函数调制的高斯核,其实都是一个意思.

傅里叶变换不能同时进行时域与频域分析, 1946年D.Gabor提出加窗傅里叶变换, 通过在时间轴位置p加窗实现对p周围小范围内信号的短时分析, 即现在的短时傅里叶变换. 通过对点p的平移,则可实现对整个时域的信号分析. 其通过窗函数g(t-p)与原信号的乘积对原信号进行在p点周围开窗, 在其它时域抑制,然后进行傅里叶变换, 这边是Gabor变换了. Gabor使用高斯函数作为窗函数.

Gabor算不算小波,都有一定说法. Gabor没有正交基,,不算小波.而且也不能自动调节分辨率的. 但是其可以反映信号局部区域的特征,对图像边缘敏感, 且可以做到在不同方向不同尺度下的局部区域特征提取.当去除Gabor变换的直流分量时可以去除光照影响,因而Gabor小波被广泛用于图像识别领域.

一维Gabor函数

为了更好的理解Gabor在时域上的分析能力,我们从一维看起

f(t)为一维信号,其傅里叶变换为

信号与高斯函数

卷积,即加窗可得

, 这就是所谓的Gabor变换

可看出t取p时,高斯函数是取到最大的,t向两边延伸,则f(t)的取值被迅速消弱.即Gabor在p点的变换即主要取p周围3* σ范围的信号, 且离得越远作用越小. 将p依次在时间轴上移动,即可得到在时域内的信号分析

二维Gabor函数及其推导

二维Gabor函数则是二维高斯函数与二维傅里叶的卷积

令f=1/λ则最后这个除了归一化系数外就是维基百科上的Gabor的复形式了(同时假设γ=1, 即高斯函数两个方向的尺度是一样的x'^2+y'^2=x^2+y^2)

http://en.wikipedia.org/wiki/Gabor_filter

λ表示正弦波长

θ表示Gabor函数条纹的方向

ψ表示相位,我们假设为0,

σ表示高斯函数的标准差

γ表示空间纵横比我们已做假设值为1

Gabor滤波器设计

Gabor滤波器核的通常形式为

上面两个等号一个意思, 只是怕截图后第一个等号字太小看不清了,又换了exp的表达.

由此可得Gabor核的实部为

式中x,y为位置坐标,

σ为高斯函数的标准差, 与小波的带宽有关,这里一般取常数.

k确定了Gabor的尺度, k=k_max/f^n, 这里k_max为最大频率,f是频域中的间隔因子,n是尺度序号, 取值0…N-1. f一般大于0,取固定值,当n增大时尺度增大,分辨率变低,n降低时分辨率更精细.在相同的尺度n下,如果增大f的话其也相当于增大尺度的效果.

θ确定了Gabor的方向, θ=pi*m/M, M为总的方向数,u为方向序号,取值0…M-1.

参考了众多说明, 一般是取值为Kmax=pi/2, f=sqrt(2.0), σ=2pi, 但没找到出处.

稍后代码参照上述描述的Gabor核实现.

[参考文献]

[1]Handbook ofFace Recognition 2nd Edition

[2]JoineBook.Com_Springer.Computer.Vision.A.Reference.Guide.Jun.2014

[3] http://en.wikipedia.org/wiki/Gabor_filter

[4] Movellan,Javier R."Tutorialon Gabor Filters". Retrieved 2008-05-14.

[5]http://blog.csdn.net/sunboyiris/article/details/21559505

猜你喜欢

转载自aaabes.iteye.com/blog/2347265