SVM超平面推导

版权声明:转载请说明来源,谢谢 https://blog.csdn.net/wsp_1138886114/article/details/82290786
目标:SVM模型是为求得使几何间隔最大的超平面: y = w · x + b
由点面之间的距离:
y i ( w x i + b ) | | w | | = γ i

其中 γ 是几何间隔, w 是超平面法向量, b 是超平面截距, y i 是样本 i 的标记。

考虑到几何问题与函数问题的关系:

(1) M a x w , b         γ = γ ^ | | w | | (2) S . t .         y i ( w x i + b ) | | w | | γ         i = 1 , 2 , 3... N

因为: γ ^ 的取值不会影响上述不等式的成立,所以不妨取其为1。
注意到, M a x : 1 | | w | | M i n : 1 2 | | w | | 2 w , b 等价,于是:

问题变为:

(3) M i n w , b         1 2 | | w | | 2 (4) S . t .         y i ( w x i + b ) 1 0         i = 1 , 2 , 3 . , N

构建拉格朗日函数其中, α = ( α 1 , α 2 , α 3 , . . . . α i , ) T       i = 1 , 2 , 3... N

(5) L ( w , b , α ) = 1 2 | | w | | 2 i = 1 N α ( y i ( w · x i + b ) 1 ) (6) = 1 2 | | w | | 2 i = 1 N α y i ( w · x i + b ) + i = 1 N α

根据拉格朗日对偶性,原始问题的对偶问题是 极大 极少问题:

max α min w , b L ( w , b , α )

可以分两步进行,先求L 对 w,b 的最小值,再求L对 α 的最大值

(1)求 min w , b L ( w , b , α ) :对 w,b 求偏导,令其等于0:

(7) w L ( w , b , α ) = w i N α   y i x i = 0 (8) b L ( w , b , α ) = i N α   y i = 0

得到:
(A) w = i = 1 N α   y i x i (B) i = 1 N α   y i = 0

将(A)式代入拉格朗日函数,并使用(B)式,可以得到: min w , b L ( w , b , α )

(1) L ( w , b , α ) = 1 2 i = 1 N j = 1 N α i α j y i y j ( x i · x j ) i = 1 N α i y i ( ( i = 1 N α j x j y j ) x i + b ) + i = 1 N α i (2) = 1 2 i = 1 N j = 1 N α i α j y i y j ( x i · x j ) + i = 1 N α i

(2)求 min w , b L ( w , b , α ) α 的极大值,即对偶问题::

(9) max α     1 2 i = 1 N j = 1 N α i α j y i y j ( x i · x j ) + i = 1 N α i (10) S . t .     i = 1 N α   y i = 0

由对偶问题转化为:
(11) min α     1 2 i = 1 N j = 1 N α i α j y i y j ( x i · x j ) i = 1 N α i (12) S . t .     i = 1 N α   y i = 0

对(11)式关于 α i 的偏导并令其为 0,结合约束条件可以解得 α
由于原始问题与对偶问题满足共解条件,所以可以使用α*代入式(A)和式(B)
求得
w*=∑Niα*iy¬ixi …………………..(C)
由KKT互补条件知:
α i(y¬i (w*xi+b)-1)=0 i=1,2,3,……..N
因为w*不为0,显然有α*j>0存在,对于这样的α*j,j可以使下式成立
yj(w*xj+b*)-1=0
=>
yj(w*xj+b*)- y2j=0
=>
w*xj+b*- yj=0

将(C)式代入上式,可以得到:
∑Niαiy¬ixixj+ b - yj =0
=>
b*=yj - ∑Niα*iy¬ixixj

至此,超平面求出,即:
∑Niαiy¬i(xixj)+b =0

猜你喜欢

转载自blog.csdn.net/wsp_1138886114/article/details/82290786