ECCV2012跟踪算法CSK原理及代码解析

相信看懂相关滤波鼻祖算法MOSSE后，直接看看CSK，会产生一些疑问。本文从MOSSE出发得出CSK的相关公式，帮助大家理解。

MOSSE将相关转到频域通过最小二乘法来求解相关滤波器 $\small H^{*}$ ：

$\small \min_{H^{\ast }} \sum_{i}|F_{i}\odot H^{*}-G_{i}|^{2}$

CSK提出用一个线性分类器来求解相关滤波器：

$\small \min_{w,b} \sum_{i}^{m}L(y_{i},f(x_{i}))+\lambda ||w||^2$

是的，换件衣服我真的就不认识了。。。。。。这个公式也叫最小二乘法，确切的名字是正则化最小二乘法（RLS），也叫做岭回归。

w即为MOSSE中的相关滤波器H；

L为最小二乘法的损失函数：

$\small L(y_{i},f(x_{i}))=(y_{i}-f(x_{i}))^2$ $\small f(x_{i})=<w,x_{i}>+b$

y是理想的高斯响应，m表示样本数量，f(xi)表示图像xi与滤波器w的在频域内的点积。所以CSK所用的公式就只是在后面多了一个正则项。那么加这一项有什么意义呢？？？

加正则项的目的是为了防止求得的滤波器H过拟合。通过最小二乘法求得的相关滤波器与当前帧输入的图像F的相关性是最高的，然而我们是要用求得的滤波器结果H去预测下一帧图像中目标所在的位置。因为下一帧图像不可能和当前帧的图像一模一样，所以拟合度过高反而会影响检测的准确度，所以加入正则项来减小输入图像和滤波器之间的拟合程度，使求得的滤波器H泛化能力更强。

现在基础公式是弄懂了，怎么解呢？

作者参考了支持向量机的解法，使用了核函数，接下来先介绍一下核函数，不然又处在云里雾里看不懂了

核函数

首先核函数是个啥？干啥用？

先来个定义：通过某非线性变换 φ( x) ，将输入空间映射到高维特征空间。特征空间的维数可能非常高。如果求解只用到内积运算，而在低维输入空间又存在某个函数 K(x, y) ，它恰好等于在高维空间中这个内积，即K( x, y) =<φ( x) ⋅φ( y) > 。那么求解过程中就不用计算复杂的非线性变换，而由这个函数 K(x, y) 直接得到非线性变换的内积，使大大简化了计算。这样的函数 K(x, y) 称为核函数。

举个例子：核函数K（Kernel Function）为：K(x,y')=<φ(x),φ(y)>，其中，< , >表示点积，φ(.)表示低维到高维的映射。

x=(x1,x2,x3)；y=(y1,y2,y3)

φ(x)=(x1x1,x1x2,x1x3,x2x1,x2x2,x2x3,x3x1,x3x2,x3x3)

φ(y)=(y1y1,y1y2,y1y3,y2y1,y2y2,y2y3,y3y1,y3y2,y3y3)

令x=(1,2,3)，y=(4,5,6)；

那么

φ(x)=(1,2,3,2,4,6,3,6,9)；

φ(y)=(16,20,24,20,25,30,24,30,36)；

<φ(x),φ(y)>=16+40+72+40+100+180+72+180+324=1024

因为我们把三维空间数据映射到九维空间中，所以计算复杂。

如果我们通过核函数，直接在低维空间中计算呢？

令核函数K(x,y)=(<x,y>)^2