机器学习之支持向量机（一）

支持向量机SVM（Support Vector Machine）是一种分类器，之所以称为‘机’是因为它会产生一个二值决策结果，即它是一种决策机。SVM支持线性分类、非线性分类以及回归问题（SVR），并且通过OVR或OVO的方式可以将SVM应用在多分类领域。在不考虑集成学习算法、特定的数据集等情况时，SVM可以认为是最优秀的分类算法。

SVM的主要思想是：

（1）构建最优分割超平面（separating hyper-plane）对数据集进行分类。在实际应用中这样的超平面可能存在多个，SVM的目的在于让离超平面比较近的点尽量远离这个超平面，这样得到的模型的分类效果好、健壮性强。

（2）使用核函数将低维线性不可分的样本转化为高维特征空间线性可分，即升维和线性化。

SVM优点：泛化错误率低，结果易解释，计算开销不是很大；

SVM缺点：对参数调节和核函数的选择敏感，原始分类器不加修改仅适用于处理二分类问题。

线性可分SVM

在样本空间中，分割超平面用线性方程表示为：

其中w为法向量，决定超平面的方向；b为位移项/截距，决定了超平面与原点的距离。

假设超平面能将样本正确分类，有：

一般将支持向量到分割超平面的函数距离设置为1：

由距离公式可求出支持向量到超平面的距离，以及两个异类支持向量到超平面的间隔：

其中||w||₂为w的L₂范数，

为了求得γ的最大值，同时满足不等式条件，可将问题转化为其等价形式：

有约束的最优化问题

最优化问题一般是指对某一个函数而言，求解其在指定作用域上的全局最小/极小值问题，一般分为三种情况：

1、无约束问题

求解方法：梯度下降法、牛顿法、坐标轴下降法等。

2、等式约束问题

求解方法：消元法或Lagrange乘子法，后者等价于将原来的有约束问题转换为更多参数的无约束问题。

；其中 λ_i≠0，为Lagrange乘子

然后令Lagrange函数L对各个变量求偏导，解出这n+l个方程后可求函数极值：

3、不等式约束问题

求解方法：KTT条件，是泛拉格朗日乘子法的一种形式，主要应用于不等式约束的情况下优化函数的求解。

；λ_j≠0，μ_k≥0

KKT(Karush-Kuhn-Tucher)条件

（1）Lagrange取得可行解的充要条件

（2）初始的约束条件

（3）将不等式约束转换后的一个约束，称为松弛互补条件

（4）Lagrange乘子约束条件

（5）不等式约束需要满足的条件

可行解x必须在约束区域g(x)<0和g(x)=0取得，当可行解x在g(x)<0的区域中时，此时直接极小化f(x)即可（令μ=0消去约束）；当可行解x在g(x)=0的边界上的时候，此时等价于等式约束问题的求解。

对于参数μ的取值，在等式约束问题中，约束函数和目标函数的梯度只要满足平行即可求解；而在不等式约束问题中，若μ≠0，则说明可行解在约束区域的边界上，这时可行解应尽可能地靠近无约束情况下的解，所以在约束边界上，目标函数的负梯度方向应该远离约束区域朝向无约束区域时的解，此时约束函数的梯度方向与目标函数的负梯度方向应相同，从而得到μ>0。

原始问题与对偶问题

参考百度百科、文库和博客

https://wenku.baidu.com/view/a56f965e14791711cc7917c0.html

https://www.cnblogs.com/xxrxxr/p/7536131.html

在优化问题中，目标函数f(x)存在多种形式，如果目标函数和约束条件都为变量x的线性函数，则称问题为线性规划。每个线性规划问题都伴随着另一个线性规划的问题，称为对偶问题。在原始（primal）和对偶（dual）两个线性规划中求解任何一个时，会自动地给出另一个的最优解，当对偶问题比原始问题约束较少时，求解对偶问题比求解原始问题要方便的多。