KCF算法公式推导

1 最小二乘法求解矩阵形式推导

设训练样本集为 $(x_i,y_i)$ ，一元（向量）线性回归可表示为： $f(x_i)=w^T\vec{x_i}+b$
若把样本输入 $\vec{x_i}$ 表示成矩阵形式（设有n个样本输入，每个输入有d个特性），有： $\boldsymbol X=\begin{bmatrix}x_{11} &x_{12}&...&x_{1d}&1\\x_{21} &x_{22}&...&x_{2d}&1\\...&...&...&...&...\\x_{n1} &x_{n2}&...&x_{nd}&1\end{bmatrix}=\begin{bmatrix}{x_1^T}&&1\\{x_2^T}&&1\\...&&...\\{x_n^T}&&1\end{bmatrix}$ 其中1表示偏置 $b$ ， ${\widetilde w}=(\vec w;b)$
则多元线性回归可表示为： $\vec y=\boldsymbol X{\widetilde w}$ 其中 $\vec y=(y_1,y_2,...,y_n)$ 表示样本标签
最小二乘法可表示为 ${\underset {w}{min}||\vec y - \boldsymbol X{\widetilde w}||_2}^2=\underset{w}{min}(\vec y - \boldsymbol X{\widetilde w})^T(\vec y - \boldsymbol X{\widetilde w})$ $\begin{aligned} L_w & =\frac{1}{2}(\vec y - \boldsymbol X{\widetilde w})^T(\vec y - \boldsymbol X{\widetilde w})\\ &=\frac{1}{2}({\vec y} ^T-{\widetilde w}^T{\boldsymbol X}^T)(\vec y - \boldsymbol X{\widetilde w})\\ &=\frac{1}{2}({\vec y} ^T{\vec y} -{\vec y} ^T{\boldsymbol X}{\widetilde w}-{\widetilde w}^T{\boldsymbol X}^T{\vec y} + {\widetilde w}^T{\boldsymbol X}^T{\boldsymbol X}{\widetilde w}) \end{aligned}$ $\begin{aligned} \frac {\partial L_w} {\partial w} &=\frac{1}{2}[-(\vec y ^ T\boldsymbol X )^T-\boldsymbol X ^ T \vec y + \boldsymbol X ^ T \boldsymbol X {\widetilde w} + {\widetilde w}^T\boldsymbol X ^ T \boldsymbol X )^T] \\ &=\frac{1}{2}(-2\boldsymbol X^T \vec y+2\boldsymbol X ^T \boldsymbol X {\widetilde w} ) \end{aligned}$ 注： $\frac{\partial (\boldsymbol X \theta)}{\partial \theta}=\boldsymbol X ^ T$ ， $\frac{\partial (\theta ^ T\boldsymbol X )}{\partial \theta ^ T}=\boldsymbol X ^ T$ ， $\frac{\partial (\theta ^T \boldsymbol X)}{{\partial \theta }}=\boldsymbol X$ 即：若上下向量一样，则结果为矩阵的转置，若互为转置，则结果为原矩阵
$\frac {\partial L_w} {\partial w}=0$ $\Rightarrow \boldsymbol X^T \vec y=2\boldsymbol X ^T \boldsymbol X {\widetilde w}$ $\Rightarrow {\widetilde w} = (\boldsymbol X^T \boldsymbol X)^{-1}\boldsymbol X^T \vec y$

2 岭回归求解公式

当数据特征较样本数多时，即样本数不足（d>n：未知数个数大于方程个数），输入数据不是满秩矩阵，这将导致非满秩矩阵 $\boldsymbol X^T \boldsymbol X$ 在求逆时会发生问题。岭回归是在 $\boldsymbol X^T \boldsymbol X$ 上加一个正则项 $\lambda \boldsymbol I$ 从而使矩阵非奇异，进而能对 $\boldsymbol X^T \boldsymbol X+\lambda \boldsymbol I$ 求逆，即： $\Rightarrow {\widetilde w} = (\boldsymbol X^T \boldsymbol X+\lambda \boldsymbol I)^{-1}\boldsymbol X^T \vec y$ $\lambda$ 是正则化系数，可提供分类器泛化性，防止过拟合。当 $\lambda$ 较小时，系数与普通矩阵一样，而较大时，使得求解的参数都接近于0
注：岭回归的最小二乘法可表示为： ${\underset {w}{min}(||\vec y - \boldsymbol X{\widetilde w}||_2}^2+{\lambda||\widetilde w||_2}^2)$
由于KCF算法是在傅里叶域内计算，牵涉到复数矩阵，所以我们将结果都统一写成复数域中形式 $\Rightarrow {\widetilde w} = (\boldsymbol X^H \boldsymbol X+\lambda \boldsymbol I)^{-1}\boldsymbol X^H \vec y \tag{1}$
其中 $\boldsymbol X$ 表示由基样本生成的循环矩阵， $\boldsymbol X ^H$ 表示其复数的共轭转置

3 循环矩阵在傅氏空间对角化

循环矩阵公式表达及直观表示 $\boldsymbol X=\boldsymbol C(\vec x)=\begin{bmatrix} x_1& x_2 & x_3&...&x_n \\ x_n&x_1& x_2 &...&x_{n-1}\\ x_{n-1}&x_{n}& x_1 &...&x_{n-2}\\ ...&...&...&...&...&\\ x_2 & x_3&x_4&...&x_1\\ \end{bmatrix}$
任何循环矩阵可以被傅里叶变换矩阵对角化，即 $\boldsymbol X=\boldsymbol C(x)=\boldsymbol F diag(\widehat x)\boldsymbol F ^ H \tag{2}$ 其中 $\widehat x由\boldsymbol X$ 的第1行元素(即基样本)经傅里叶变换后得到， $\boldsymbol F$ 是离散傅里叶变换矩阵，是一个常量 $\boldsymbol F=\frac {1}{\sqrt n}\begin{bmatrix}1&1&...&1&1\\1& \omega &...&\omega ^{n-2}&\omega ^{n-1}\\1&\omega ^ 2 &...&\omega ^{2(n-2)}&\omega ^{2(n-1)}\\...&...&...&...&...\\1&\omega ^{n-1}&...&\omega ^{(n-1)(n-2)}&\omega ^{(n-1)^2}\end{bmatrix}$
要计算 $(1)$ 式，先求 $\boldsymbol X^H \boldsymbol X$ ,将 $(2)$ 式代可得 $\begin{aligned} \boldsymbol X^H \boldsymbol X & =(\boldsymbol F diag(\widehat x)\boldsymbol F^H)^H \boldsymbol F diag(\widehat x)\boldsymbol F^H\\ &=(\boldsymbol F^H)^H diag(\widehat x)^H\boldsymbol F ^H \boldsymbol F diag(\widehat x)\boldsymbol F^H \\ &=\boldsymbol F diag(\widehat x ^ *)\boldsymbol F^H \boldsymbol F diag(\widehat x)\boldsymbol F^H\\ &= \boldsymbol F diag(\widehat x ^ * \odot \widehat x ) \boldsymbol F^H \tag{3} \end{aligned}$ 1.其中 $\widehat x ^ *$ 与 $\widehat x$ 是共轭关系
2. $\widehat x$ 表示 $\vec x$ 的离散傅里叶变换，即 $\widehat x=\mathcal F(\vec x)=\sqrt n \boldsymbol F x$
3. $(\boldsymbol A\boldsymbol B\boldsymbol C)^H=\boldsymbol C^H \boldsymbol B^H \boldsymbol A^H$
4. $\boldsymbol F^H \boldsymbol F = \boldsymbol F \boldsymbol F^H = \boldsymbol I$
5. $diag\left\{(\widehat x)^H\right\}=diag\left\{(\widehat x ^ *)^T\right\}=diag(\widehat x ^ *)$ ----对角矩阵的转置不变
6. $diag(\boldsymbol A) diag(\boldsymbol B)=diag(\boldsymbol A \odot \boldsymbol B)$ ----符号 $\odot$ 表示矩阵element-wise的乘法
将 $(3)$ 代入 $(1)$ 得： $\begin{aligned} {\widetilde w} &= (\boldsymbol X^H \boldsymbol X+\lambda \boldsymbol I)^{-1}\boldsymbol X^H \vec y\\ &=(\boldsymbol F diag(\widehat x ^ * \odot \widehat x ) \boldsymbol F^H+\lambda \boldsymbol F \boldsymbol I \boldsymbol F^H)^{-1}\boldsymbol X^H \vec y\\ &=(\boldsymbol F diag(\widehat x ^ * \odot \widehat x ) \boldsymbol F^H+\boldsymbol F diag(\lambda)\boldsymbol F^H)^{-1}\boldsymbol X^H \vec y\\ &=(\boldsymbol F diag(\widehat x ^ * \odot \widehat x+\lambda ) \boldsymbol F^H)^{-1}\boldsymbol X^H \vec y\\ &=[(\boldsymbol F^H)^{-1}diag(\widehat x ^ * \odot \widehat x+\lambda ) ^{-1}\boldsymbol F^{-1}]\boldsymbol X^H \vec y\\ &=[\boldsymbol Fdiag(\frac {1}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol F^{-1}]\boldsymbol X^H \vec y \tag{4} \end{aligned}$ 1. $\lambda \boldsymbol I = \lambda \boldsymbol F \boldsymbol F^H=\lambda \boldsymbol F \boldsymbol I \boldsymbol F^H$
2. $\boldsymbol A \boldsymbol B \boldsymbol C+\boldsymbol A\boldsymbol D\boldsymbol C=\boldsymbol A(\boldsymbol B +\boldsymbol D)\boldsymbol C$
3. $\boldsymbol F \boldsymbol F^H=\boldsymbol I\Rightarrow \boldsymbol F^H=\boldsymbol F^{-1}$
4. $\boldsymbol F \boldsymbol F^H=\boldsymbol I\Rightarrow \boldsymbol F=(\boldsymbol F^H)^{-1}$
5. $diag(\lambda_i)^{-1}=diag(\frac{1}{\lambda_i})$
将 $(2)$ 式代入 $(4)$ 式得： $\begin{aligned} {\widetilde w} &=[\boldsymbol Fdiag(\frac {1}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol F^{-1}][\boldsymbol F diag(\widehat x)\boldsymbol F ^ H ]^H \vec y\\ &=[\boldsymbol Fdiag(\frac {1}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol F^{-1}][(\boldsymbol F^H)^Hdiag(\widehat x)^H\boldsymbol F^H]\vec y\\ &=\boldsymbol Fdiag(\frac {1}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol F^{-1}\boldsymbol Fdiag(\widehat x)^H\boldsymbol F^H \vec y\\ &=\boldsymbol Fdiag(\frac {1}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol I diag(\widehat x)^H\boldsymbol F^H \vec y\\ &=\boldsymbol Fdiag(\frac {1}{\widehat x ^ * \odot \widehat x+\lambda} ) diag(\widehat x)^H\boldsymbol F^H \vec y\\ &=\boldsymbol Fdiag(\frac {\widehat x^H}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol F^H \vec y\\ &=\boldsymbol Fdiag(\frac {\widehat x^*}{\widehat x ^ * \odot \widehat x+\lambda} ) \boldsymbol F^H \vec y\tag{5} \end{aligned}$
继续推导 $\widehat x=\mathcal F(x)\Rightarrow x=\mathcal F^{-1}(\widehat x) (\mathcal F^{-1}表示傅里叶逆变换)$ $\begin{aligned}\boldsymbol X=\boldsymbol C(\vec x)&=\boldsymbol C(\mathcal F^{-1}(\widehat x) )\\ &=\boldsymbol F diag(\widehat x)\boldsymbol F ^ H \tag{6} \end{aligned}$
结合 $(5)$ 式和 $(6)$ 式得： ${\widetilde w} = \boldsymbol C[\mathcal F^{-1} (\frac {\widehat x^*}{\widehat x ^ * \odot \widehat x+\lambda})]\vec y\tag{7}$
利用循环卷积性质： $\begin{aligned}\mathcal F(\boldsymbol X \vec y)&=\mathcal F[\boldsymbol C(\vec x)\vec y]\\ &=\widehat x ^ * \odot \widehat y\\ &=\mathcal F^*(\vec x)\odot\mathcal F(\vec y)\tag{8} \end{aligned}$
结合 $(7)$ 式和 $(8)$ 式得： $\begin{aligned}\mathcal F({\widetilde w})&=\mathcal F(\boldsymbol C[\mathcal F^{-1} (\frac {\widehat x^*}{\widehat x ^ * \odot \widehat x+\lambda})]\vec y)\\ &=\mathcal F^*[\mathcal F^{-1} (\frac {\widehat x^*}{\widehat x ^ * \odot \widehat x+\lambda})]\mathcal F(\vec y)\\ &=(\frac {\widehat x^*}{\widehat x ^ * \odot \widehat x+\lambda})^*\odot \widehat y\\ &=\frac {(\widehat x^*)^*}{(\widehat x ^ * \odot \widehat x+\lambda)^*}\odot \widehat y\\ &=\frac {\widehat x\odot \widehat y}{\widehat x ^ * \odot \widehat x+\lambda} \end{aligned}$ $\Rightarrow \mathcal F({\widetilde w})=\widehat w = \frac {\widehat x\odot \widehat y}{\widehat x ^ * \odot \widehat x+\lambda}\tag{9}$ 1. $\widehat w$ 表示 $\widetilde w$ 的傅里叶变换， ${\widetilde w}$ 表示 $(\vec w;b)$ 即实域空间的分类器参数
2.由于 $\widehat x ^ *$ 是 $\widehat x$ 的共轭，所以 $\widehat x ^ * \odot \widehat x$ 是实数，其共轭为本身
3. $\odot$ 表示对应元素相乘，——表示对应元素相除
由上述推导可得分类器参数 ${\widetilde w}$ ： ${\widetilde w}={\mathcal F}^{-1}(\widehat w)={\mathcal F}^{-1}(\frac {\widehat x\odot \widehat y}{\widehat x ^ * \odot \widehat x+\lambda})\tag{10}$ 1. $\widehat x，\widehat y$ 分别表示基样本、标签的傅里叶变换
2.将矩阵运算在傅里叶域转化为点积运算，成其是矩阵求逆运算，大大提高了计算速度
3.上式为线性回归下利用循环矩阵其滤波器的计算公式

4. 非线性回归滤波器求解

求解方式：找到一个非线性映射函数 $\varphi(x)$ ，使映射后的样本在新空间中线性可分，那么在新空间中就可以使用脊回归来寻找一个分类器 $f(\boldsymbol x_i)=\boldsymbol w^T\varphi(\boldsymbol x_i)$ ，其中 $\varphi \boldsymbol {(x_i)}$ 表示对样本 $\boldsymbol x_i$ 通过非线性映射函数 $\varphi$ 进行变换。
将线性滤波器的解 $\boldsymbol w$ 用样本的线性组合来表示： $\boldsymbol w=\sum_i \alpha_i {\varphi(\boldsymbol x_i)}$ 则最优化问题不再是求变量 $w$ ，而是 $\alpha$ 。该表达式是在对偶空间中进行的，具体参考SVM相关理论。
线性条件下的回归问题，经过非线性变换后为： $\begin{aligned} f(z)&=\boldsymbol w^T\boldsymbol z\\ &=(\sum_i^n \alpha_i {\varphi(\boldsymbol x_i)})^T.\varphi(\boldsymbol z)\\ &=\sum_i^n {\alpha_i}\varphi^T(\boldsymbol x_i)\varphi(\boldsymbol z)\\ &=\sum_i^n\alpha_i\mathcal K(\boldsymbol x_i,\boldsymbol {z}) \end{aligned}$ 1. $\mathcal K(\boldsymbol x,\boldsymbol x')=\varphi^T{(\boldsymbol x)}{\varphi(\boldsymbol x')}$ ， $\mathcal K$ 表示核函数，如高斯或多项式
2. $K_{ij}=\mathcal K(\boldsymbol x_i,\boldsymbol x_j)$ ， $K$ 为 $n \times n$ 的核矩阵，表示所有样本对的点乘操作
3. $n$ 表示训练样本个数
核函数下岭回归的解为： $\boldsymbol \alpha=(K+\lambda I)^{-1}\boldsymbol y\tag{11}$ 1. $\boldsymbol \alpha$ 为线性组合系数 $\alpha_i$ 组成的向量
2. $K$ 为核矩阵，其各个元素 $K_{i,j}$ 如前所述
3. $\lambda$ 为正则化系数
4.推导过程参考Kernel ridge Regression
定理 1. 给定循环数据 $C(\boldsymbol x)$ ，对于任意的变换矩阵 $M$ ，如果核函数 $\mathcal K$ 满足 $\mathcal K(\boldsymbol x,\boldsymbol x')=\mathcal K(M\boldsymbol x,M\boldsymbol x')$ ，则核矩阵 $K$ 是循环矩阵，证明如下： $\begin{aligned}K_{ij}&=\mathcal K(\boldsymbol x,\boldsymbol x')\\ &=\mathcal K({P^i \boldsymbol x}，{P^j \boldsymbol x})\end{aligned}$ $\begin{aligned}\mathcal K(M\boldsymbol x,M\boldsymbol x')&=\mathcal K(P^{-i}P^i \boldsymbol x,{P^{-i}P^j \boldsymbol x})\\ &=\mathcal K(\boldsymbol x,P^{j-i}\boldsymbol x)\\ &=\mathcal K(\boldsymbol x,P^{(j-i) \% n}\boldsymbol x)=K_{ij} \end{aligned}$ 1.由上式可看出， $K_{i,j}$ 只依赖于 $(j-i)$ 和 $n$ ，所以 $K$ 为循环矩阵
2. $P$ 为置换矩阵，如： $P=\begin{bmatrix} 0&0&0&...&1\\ 1&0&0&...&0\\ 0&1&0&...&0\\ ...&...&...&...&...\\ 0&0&1&...&0 \end{bmatrix}$ $\boldsymbol x_1=P^0\boldsymbol x=\boldsymbol x=[x_1,x_2,...,x_n]^T$
$\boldsymbol x_2=P^1\boldsymbol x=[x_n,x_1,...,x_{n-1}]^T$
…
$\boldsymbol x_n=P^{n-1}\boldsymbol x=[x_2,x_3,...,x_1]^T$
由 $K$ 为循环矩阵，利用对角化性质，核滤波器表达式 $(11)$ 变换如下： $\begin{aligned} \boldsymbol \alpha&=[C({\boldsymbol k ^{\boldsymbol x \boldsymbol x})}+\lambda I]^{-1} \boldsymbol y\\ &=[Fdiag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}})F^H+\lambda I]^{-1} \boldsymbol y\\ &=[Fdiag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}})F^H+\lambda FIF^H]^{-1} \boldsymbol y\\ &=[Fdiag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}})F^H+ Fdiag(\lambda)F^H]^{-1} \boldsymbol y\\ &=[Fdiag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda})F^H]^{-1} \boldsymbol y\\ &=(F^H)^{-1}(diag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda})^{-1})F^{-1} \boldsymbol y\\ &=Fdiag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda)}^{-1}F^H\boldsymbol y \tag{12} \end{aligned}$ 1. $K=C({\boldsymbol k ^{\boldsymbol x \boldsymbol x}})$ ， ${\boldsymbol k ^{\boldsymbol x \boldsymbol x}}$ 为矩阵 $K$ 的第一行
2.由 $FF^H=I$ $\Rightarrow$ $F^H=F^{-1}$
对 $(12)$ 两边同时左乘 $F^H$ 得 $\begin{aligned} F^H \boldsymbol \alpha&=F^HFdiag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda)}^{-1}F^H\boldsymbol y\\ &=diag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda)}^{-1}F^H\boldsymbol y \end{aligned}$ $F^H \boldsymbol \alpha$ 表示 ${\boldsymbol \alpha}$ 经傅里叶变换后的共轭转置，则 $F^H\boldsymbol \alpha=[\widehat{\boldsymbol \alpha}^*]^T$ ，则上式可转换为： $\begin{aligned} [\widehat{\boldsymbol \alpha}^*]^T &= diag({\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda)}^{-1}F^H\boldsymbol y\\ &=diag(\frac{1}{{\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda}})[{\widehat \boldsymbol y^*}]^T\\ &=[diag(\frac{1}{{\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda}}){{\widehat \boldsymbol y^*}}]^T \end{aligned}$ $\Rightarrow \widehat{\boldsymbol \alpha}^*=diag(\frac{1}{{\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda}}){{\widehat \boldsymbol y^*}}$ 1. $diag(\lambda)^{-1}=diag(\frac{1}{\lambda})$
2. $F^H\boldsymbol y=\widehat \boldsymbol y^*$
由于一个对角矩阵与一个向量相乘，相当于元素级乘法，因此： $\widehat{\boldsymbol \alpha}^*=\frac{{{\widehat \boldsymbol y^*}}}{{\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda}}$ 等式两边同时取共轭，得： $\widehat{\boldsymbol \alpha}=\frac{{{\widehat \boldsymbol y}}}{{\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}+\lambda}}\tag{13}$ 更一般地，矩阵 $K$ 中每一行 $K_i^{\boldsymbol x \boldsymbol x'}=\mathcal K(\boldsymbol x'，P^{i-1}\boldsymbol x)$ 1. $i$ 为第 $K$ 的第 $i$ 行，即在基样本上进行 $i-1$ 次循环移位
2. $x$ 表示基样本，即 $K$ 的第一行
3. ${\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol x}}$ 表示 $x$ 在傅里叶域进行自相关

5 快速检测

由式 $(11)$ 可得： $f(\boldsymbol z) =K {\boldsymbol \alpha}\tag{14}$ 1.正则化仅用来求解 $\boldsymbol \alpha$ ，在回归时不需要正则项
2. ${\boldsymbol z}$ 表示待检测的图像块
在实用场景下， $(14)$ 可表示为： $f(\boldsymbol z) =(K^{\boldsymbol z})^T \boldsymbol \alpha \tag{15}$ 1. $\boldsymbol \alpha$ 为训练好的分类器参数
2. $K^{\boldsymbol z}=C({\boldsymbol k ^{\boldsymbol x \boldsymbol z}})=\mathcal K(P^{i-1} \boldsymbol z,P^{j-1} \boldsymbol x)$ ，表示训练样本和待检测样本之间的核矩阵，是一个非对称矩阵
3. $\boldsymbol x$ 表示待训练基样本， $\boldsymbol z$ 表示待检测基样本
继续 $(15)$ 式推导 $\begin{aligned} f(\boldsymbol z) &=[C({\boldsymbol k ^{\boldsymbol x \boldsymbol z}})]^T \boldsymbol \alpha\\ &=Fdiag({ (\widehat\boldsymbol k ^{\boldsymbol x \boldsymbol z}})^*)F^H\boldsymbol \alpha\\ &=C(({\boldsymbol k ^{\boldsymbol x \boldsymbol z}})^*)\boldsymbol \alpha \tag{16} \end{aligned}$ 注：上述推导利用了循环矩阵的转置性质，即转置后的特征值与原特征值互为共轭，用公式表达为： $X^T=Fdiag((\widehat\boldsymbol x)^*)F^H$ 其中矩阵 $diag((\widehat\boldsymbol x)^*)$ 对角线上的值为矩阵 $X^T$ 的特征值
对 $(16)$ 式两边同时进行傅里叶变换，得： $\mathcal F(f(\boldsymbol z))=\mathcal F(C(({\boldsymbol k ^{\boldsymbol x \boldsymbol z}})^*)\boldsymbol \alpha)$ 利用循环卷积性质（如式 $(8)$ 所示），得： $\begin{aligned} \mathcal F(f(\boldsymbol z))&=\mathcal F ^ *(({\boldsymbol k ^{\boldsymbol x \boldsymbol z}})^*) \odot \mathcal F(\boldsymbol \alpha)\\ &=\mathcal F ({\boldsymbol k ^{\boldsymbol x \boldsymbol z}}) \odot \mathcal F(\boldsymbol \alpha) \end{aligned}$ 即： $\widehat f(\boldsymbol z)={\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol z}} \odot \widehat \boldsymbol \alpha \tag{17}$ 1. ${ \boldsymbol k ^{\boldsymbol x \boldsymbol z}}$ 为核矩阵 $K$ 的第一行
2. ${\widehat \boldsymbol k ^{\boldsymbol x \boldsymbol z}}$ 为训练样本 $x$ 与待测样本 $z$ 在傅里叶域的核相关

6 快速核相关

6.1 点积与多项式核

对于某种点积核函数 $g$ ，其核函数可表示为： $\mathcal K(\boldsymbol x,\boldsymbol x')=g(\boldsymbol x^T\boldsymbol x')$ 注： $g$ 表示输入向量间的元素级操作 ${k_i^{\boldsymbol x\boldsymbol x'}}=\mathcal K(\boldsymbol x',P^{i-1}\boldsymbol x)=g(\boldsymbol {x'}^TP^{i-1}\boldsymbol x)$ $k^{\boldsymbol x \boldsymbol x'}=g(C(\boldsymbol x)\boldsymbol x') (证明略)$ 由循环矩阵性质可知： $\mathcal F(C(\boldsymbol x)\boldsymbol x')=\widehat \boldsymbol x^* \odot \boldsymbol x'$
$\Rightarrow C(\boldsymbol x)\boldsymbol x' = \mathcal F^{-1}(\widehat \boldsymbol x^* \odot \widehat \boldsymbol x')$ $\Rightarrow k^{\boldsymbol x \boldsymbol x'}=g(\mathcal F^{-1}(\widehat \boldsymbol x^* \odot \widehat \boldsymbol x'))$
特殊地，对于多项式核 $\mathcal K(\boldsymbol x,\boldsymbol x')=(\boldsymbol x^T\boldsymbol x'+a)^b$ $\Rightarrow k^{\boldsymbol x \boldsymbol x'}=(\mathcal F^{-1}(\widehat \boldsymbol x^* \odot \widehat \boldsymbol x')+a)^b\tag{18}$

6.2 径向基函数与高斯核

对于某种径向基函数 $h$ ，其核函数可表示为： $\mathcal K(\boldsymbol x,\boldsymbol x')=h(||\boldsymbol x-\boldsymbol x'||^2)$ $\begin{aligned} k_i^{\boldsymbol x \boldsymbol x'}=\mathcal K(\boldsymbol x',P^{i-1}\boldsymbol x)&=h(||\boldsymbol x'-P^{i-1}\boldsymbol x||^2)\\ &=h(||\boldsymbol x'||^2+||P^{i-1}\boldsymbol x||^2-2\boldsymbol x'^TP^{i-1}\boldsymbol x)\\ &=h(||\boldsymbol x'||^2+||\boldsymbol x||^2-2\boldsymbol x'^TP^{i-1}\boldsymbol x)\\ &=h(||\boldsymbol x'||^2+||\boldsymbol x||^2-2\mathcal F^{-1}(\widehat \boldsymbol x^*\odot\widehat\boldsymbol x')) \end{aligned}$ 注：上式转换中去除了转换矩阵 $P^{i-1}$ ，因为矩阵的循环移位不影响其范数
特殊地，对于高斯核 $\mathcal K(\boldsymbol x,\boldsymbol x')=exp(-\frac{1}{\sigma^2}||\boldsymbol x-\boldsymbol x'||^2)$ $\Rightarrow k^{\boldsymbol x \boldsymbol x'}=exp(-\frac{1}{\sigma^2}(||\boldsymbol x'||^2+||\boldsymbol x||^2-2\mathcal F^{-1}(\widehat \boldsymbol x^*\odot\widehat\boldsymbol x')))\tag{19}$

7 伪代码

//训练分类器alphaf
function alphaf = train(x, y, sigma, lambda)
	k = kernel_correlation(x, x, sigma);
	alphaf = fft2(y) ./ (fft2(k) + lambda);
end
//计算响应f(z)
function responses = detect(alphaf, x, z, sigma)
	k = kernel_correlation(z, x, sigma);
	responses = real(ifft2(alphaf .* fft2(k)));
end
//计算核相关矩阵
function k = kernel_correlation(x1, x2, sigma)
	c = ifft2(sum(conj(fft2(x1)) .* fft2(x2), 3));
	d = x1(:)’*x1(:) + x2(:)’*x2(:) - 2 * c;
	k = exp(-1 / sigma^2 * abs(d) / numel(d));
end

1 最小二乘法求解矩阵形式推导

2 岭回归求解公式

3 循环矩阵在傅氏空间对角化

4. 非线性回归滤波器求解

5 快速检测

6 快速核相关

6.1 点积与多项式核

6.2 径向基函数与高斯核

7 伪代码

猜你喜欢