版权声明:转载请说明来源,谢谢 https://blog.csdn.net/wsp_1138886114/article/details/82290786
目标:SVM模型是为求得使几何间隔最大的超平面:
y=w⋅x+b
-
由点面之间的距离:
-
yi(wxi+b)||w||=γi
其中
γ
是几何间隔,
w
是超平面法向量,
b
是超平面截距,
yi
是样本
i
的标记。
考虑到几何问题与函数问题的关系:
Maxw,bS.t. γ=γ^||w|| yi(wxi+b)||w||⩾γ i=1,2,3...N(1)(2)
因为:
γ^
的取值不会影响上述不等式的成立,所以不妨取其为1。
注意到,
Max:1||w||⇔Min:12||w||2(对w,b参数)
等价,于是:
问题变为:
Minw,bS.t. 12||w||2 yi(wxi+b)−1⩾0 i=1,2,3….,N(3)(4)
构建拉格朗日函数其中,
α=(α1,α2,α3,....αi,)T i=1,2,3...N
:
L(w,b,α)==12||w||2−∑i=1Nα(yi(w⋅xi+b)−1)12||w||2−∑i=1Nαyi(w⋅xi+b)+∑i=1Nα(5)(6)
根据拉格朗日对偶性,原始问题的对偶问题是 极大 极少问题:
maxαminw,bL(w,b,α)
可以分两步进行,先求L 对 w,b 的最小值,再求L对
α
的最大值:
(1)求
minw,bL(w,b,α)
:对 w,b 求偏导,令其等于0:
▽wL(w,b,α)=▽bL(w,b,α)=w−∑iNα yixi=0∑iNα yi=0(7)(8)
得到:
w=∑i=1Nα yixi∑i=1Nα yi=0(A)(B)
将(A)式代入拉格朗日函数,并使用(B)式,可以得到:
minw,bL(w,b,α)
L(w,b,α)==12∑i=1N∑j=1Nαiαjyiyj(xi⋅xj)−∑i=1Nαiyi((∑i=1Nαjxjyj)⋅xi+b)+∑i=1Nαi−12∑i=1N∑j=1Nαiαjyiyj(xi⋅xj)+∑i=1Nαi(1)(2)
(2)求
minw,bL(w,b,α)对α
的极大值,即对偶问题::
maxα S.t. −12∑i=1N∑j=1Nαiαjyiyj(xi⋅xj)+∑i=1Nαi∑i=1Nα yi=0(9)(10)
由对偶问题转化为:
minα S.t. 12∑i=1N∑j=1Nαiαjyiyj(xi⋅xj)−∑i=1Nαi∑i=1Nα yi=0(11)(12)
对(11)式关于
αi
的偏导并令其为 0,结合约束条件可以解得
α∗
,
由于原始问题与对偶问题满足共解条件,所以可以使用α*代入式(A)和式(B)
求得
w*=∑Niα*iy¬ixi …………………..(C)
由KKT互补条件知:
α
i(y¬i (w*xi+b)-1)=0 i=1,2,3,……..N
因为w*不为0,显然有α*j>0存在,对于这样的α*j,j可以使下式成立
yj(w*xj+b*)-1=0
=>
yj(w*xj+b*)- y2j=0
=>
w*xj+b*- yj=0
将(C)式代入上式,可以得到:
∑Niαiy¬ixixj+ b - yj =0
=>
b*=yj - ∑Niα*iy¬ixixj
至此,超平面求出,即:
∑Niαiy¬i(xixj)+b =0