机器学习之支持向量机SVM Support Vector Machine (二) 非线性SVM模型与核函数

求解线性分类问题，线性SVM是一种非常有效的方法，但是有时分类问题是非线性的，这时可以使用非线性SVM。非线性问题往往不好求解，希望能用解线性分类问题的方法解决这个问题，可以采用非线性变换，将非线性问题变换为线性问题，通过解决变换后的线性问题的方法求解原来的非线性问题。
在线性回归中，可以将多项式回归转化为线性回归。比如一个只有两个特征的p次多项式回归模型：

令

，得到：

这是一个五元线性回归，可以用线性回归的方法来解决。对于每一个二元样本特征

，得到一个五元样本特征

，通过这个改进的五元样本特征，把不是线性回归的函数变成线性回归。也就是说，对于二维的不是线性的数据，将其映射到五维后就变成了线性数据。这给了我们启发，对于在低维线性不可分的数据，映射到高维后就变成线性可分的了。这个思想同样可以运用到SVM线性不可分数据上。

一、核函数

回顾线性SVM的优化目标函数：

注意到上式低维特征仅以内积

的形式出现，如果定义一个低维特征空间到高维特征空间的映射，将所有特征映射到一个更高的维度，使数据线性可分，就可以按之前的方法来优化目标函数，求出分离超平面和分类决策函数。现在SVM的优化目标函数变成：

可以看到，和线性SVM的优化目标函数的区别仅仅是将内积

替换为

。核函数定义如下：
假设ϕ是一个从低维的输入空间χ（欧氏空间的子集或离散集合）到高维的希尔伯特空间H的映射，存在函数K(x,z)，对于任意x,z∈χ，都有：

称K(x,z)为核函数。
K(x,z)的计算是在低维特征空间来计算的，避免了在高维空间计算内积的巨大计算量。核函数的好处在于它在低维上进行计算，而将实质上的分类效果（利用内积）表现在了高维上，避免了直接在高维空间中的复杂计算。对于给定的核函数，特征空间和映射函数的取法并不唯一，可以取不同的特征空间，即便是在同一特征空间里也可以取不同的映射。