机器学习之支持向量机SVM Support Vector Machine (一) 线性SVM模型与软硬间隔 - 代码天地

机器学习之支持向量机SVM Support Vector Machine (一) 线性SVM模型与软硬间隔

其他 2018-10-30 14:49:19 阅读次数: 0

一、简介

SVM是一种二类分类模型，它的目标是利用训练数据集的间隔最大化找到最优分离超平面。SVM还包括核技巧，使它成为非线性分类器。

SVM学习方法包含由简至繁的模型：线性可分SVM（硬间隔SVM）、线性SVM（软间隔SVM）、非线性SVM。

二、间隔与支持向量

给定训练样本集

，分类学习的目标是基于训练集D在样本空间找到一个分离超平面，将不同类别的样本分开。当训练数据集线性可分时，存在无数个分离超平面可将两类数据正确分开，哪个分离超平面最好呢？最优分离超平面可以正确地对训练数据进行分类，也可以对未知数据进行很好的分类。假设分离超平面方程为w∙x+b=0，由法向量w和截距b决定，记为(w, b)。样本空间中任意点x到超平面(w, b)的距离可写为：

一个点距离分离超平面的远近可以表示分类预测的确信程度。给定一个特定的超平面，可以计算出训练数据集中所有样本点到超平面距离的最小值。间隔（Margin）就是这个距离的二倍。对于线性可分数据集，间隔中间是无点区域，意味着里面不会有任何数据。SVM就是利用间隔最大化求得最优分离超平面，最优超平面有最大的间隔，意味着以充分大的确信度对训练数据进行分类。

超平面H0划分数据集，满足w∙x+b=0。可以得到两个与H0等距的划分数据集超平面H1和H2，有如下方程：

由于w和b是可以缩放的，所以让δ=1来简化问题。超平面的约束如下：

将上述方程写在一起，得到：

距离超平面最近的几个训练样本点使等号成立，它们被称为支持向量。支持向量机由很少的重要的训练样本确定。超平面的间隔为

三、线性可分SVM模型

3.1 原始问题与对偶问题

欲找到具有最大间隔的分离超平面，就是要找到满足上述约束的参数w和b，使r最大，即

显然为了最大化间隔，仅需最大化

，这等价于最小化

，于是约束可重写为

这是SVM的基本型，也是一个凸二次规划问题。

根据凸优化理论，可以通过拉格朗日函数将优化目标转化为无约束的优化函数，得到对偶问题。具体来说，对式(1)的每条约束添加拉格朗日乘子

，则该问题的拉格朗日函数可写为

其中

为拉格朗日乘子向量。根据拉格朗日对偶性，原始问题的对偶问题是极大极小问题：

先求L(w,b,a)对w, b的极小值，再求对a的极大值。

求w, b的极小值可以通过对w和b分别求偏导得到

将(3)式带入(2)式即可消去w和b，并利用(4)式，得到

求

对a的极大，可以转换为求极小，得到下面的等价对偶最优化问题：

3.2 KKT条件和支持向量

对偶问题(5)解出的αi是(2)式的拉格朗日乘子，恰对应着训练样本

。注意到(1)式中有不等式约束，因此上述过程需满足KKT (Karush-Kuhn-Tucker)条件，即要求

其中模型

对任意训练样本，总有

，则该样本不会在式(6)的求和中出现，也不会对f(x)有任何影响；若

，所对应的样本点位于最大间隔边界上，是一个支持向量。这显示出支持向量机的一个重要性质：训练完成后，大部分训练样本都不需要保留，最终模型仅与支持向量有关。

3.3 线性可分SVM算法过程

只要求出a就可以求出w和b了，具体怎么极小化上式得到对应的a，一般要用到SMO算法，这个算法后面会专门介绍。这里假设通过SMO算法得到了对应的a*，那么可以求得

求b则稍微麻烦一点。注意到对任意支持向量

，都有

假设有S个支持向量，则对应求出S个b*，理论上这些b*都可以作为最终的结果，但一般采用一种更健壮的方法，即求出所有支持向量对应的b*，然后取平均值作为最终的结果。

输入：线性可分样本集

输出：分离超平面参数w*和b*，分类决策函数。

算法：

(1) 构造并求解约束最优化问题

(2) 用SMO算法求出上式最小时对应的a*

(3) 计算

(4) 找出所有S个支持向量，即满足

，通过

，计算出每个支持向量对应的

，所有

(5) 分离超平面

分类决策函数

四、线性SVM模型与软间隔最大化

4.1 软间隔

在现实任务中，训练样本并不都是线性可分的，退一步说，即便找到了分离超平面使训练集线性可分，也很难断定不是由于过拟合造成的。缓解该问题的一个办法是允许支持向量机在一些样本上出错，为此引入“软间隔”的概念。前面介绍的支持向量机要求所有样本满足约束

即所有样本都必须划分正确，这称为“硬间隔”，而软间隔允许某些样本不满足约束，但在最大化间隔的同时，不满足约束的样本应尽可能少。
对每个样本

引入一个松弛变量

，使函数间隔加上松弛变量大于等于1。与硬间隔最大化相比，可以看到对样本到超平面的函数距离要求放松了，但每个松弛变量是有代价的，引入惩罚函数C>0。软间隔最大化的SVM学习条件如下：

惩罚函数C可以理解为回归和分类问题正则化时的参数，C越大，对误分类的惩罚越大，C越小，对误分类的惩罚越小。最小化目标函数包含两层含义，使

尽量小即间隔尽量大，同时使误分类点的个数尽量少。
这是一个凸二次规划问题，关于(w,b,ξ)的解是存在的，可以证明w的解是唯一的，但b的解不唯一，存在于一个区间。假设解为w*和b*，可以得到分离超平面

及分类决策函数

，这样的模型称为训练样本线性不可分时的线性支持向量机，简称为线性SVM。显然线性SVM包含线性可分SVM，由于现实中训练数据集往往是线性不可分的，线性SVM具有更广的适用性。

4.2 软间隔最大化目标函数的优化

与线性可分SVM的优化方式类似，首先将软间隔最大化的约束问题用拉格朗日函数转化为无约束问题：

其中

均为拉格朗日系数。要优化的目标函数是

这个优化目标满足KKT条件，可以通过拉格朗日对偶将优化问题转化为等价的对偶问题求解如下：

令L(w,b,ξ,α,μ)对w,b,ξ的偏导为零可得

可以得到

可以得到对偶问题

即

对比硬间隔下的对偶问题可以看出，二者唯一的差别在于对偶变量的约束不同，硬间隔下是

，软间隔下是

。依然可以通过SMO算法来对上式极小化a，求出w和b。

4.3 软间隔最大化时的支持向量

硬间隔最大化时，根据KKT条件

，如果αi>0，则点在支持向量上。
软间隔最大化的情况稍微复杂些，KKT条件要求

4.4 软间隔最大化的线性SVM算法过程

输入：线性样本集

输出：分离超平面参数w*和b*，分类决策函数。
算法：
(1) 选择惩罚参数C>0，构造并求解约束最优化问题

(2) 用SMO算法求出上式最小时对应的a*
(3) 计算

(4) 找出所有S个支持向量，即满足

，通过

，计算出每个支持向量对应的

，

(5) 分离超平面

分类决策函数

4.5 损失函数

最优化问题还有另外一种解释如下：

其中

为损失函数，常用的损失函数有：

若采用hinge损失，并引入松弛变量

，即可得到最优化问题。如果点被正确分类且函数间隔大于1，则损失是0，否则损失是

。还可以看出其他损失函数和函数间隔的关系。对于0-1损失函数，如果分类正确，损失是0，误分类损失是1。hinge损失函数是0-1损失函数的上界。

猜你喜欢

转载自blog.csdn.net/ivy_reny/article/details/78815423

机器学习之支持向量机SVM Support Vector Machine (一) 线性SVM模型与软硬间隔

机器学习之支持向量机SVM（Support Vector Machine）

支持向量机（support vector machine）（一）：线性可分SVM

机器学习：SVM(Support Vector Machine)支持向量机简介

机器学习------支持向量机（Support Vector Machine, SVM）

【机器学习】 SVM（Support Vector Machine）——支持向量机（上）

【机器学习算法】支持向量机（support Vector Machine，SVM）

机器学习之支持向量机SVM Support Vector Machine (二) 非线性SVM模型与核函数

支持向量机(Support Vector Machine, SVM)

支持向量机（Support Vector Machine / SVM）

支持向量机（Support Vector Machine，SVM）——　线性SVM

机器学习之支持向量机SVM Support Vector Machine (五) scikit-learn算法库

机器学习之支持向量机SVM Support Vector Machine (四) SMO算法

机器学习之支持向量机SVM Support Vector Machine (六) 高斯核调参

机器学习算法之——支持向量机(Support Vector Machine, SVM）

【A-017】 python数据分析与机器学习实战支持向量机原理（一） SVM Support Vector Machine

这段代码是一个机器学习中的支持向量机（Support Vector Machine，SVM）分类器的示例

支持向量机（Support Vector Machine SVM）前篇 SVM的建模及优化思想——机器学习

支持向量机（support vector machine）（二）：线性SVM

机器学习人工智能算法——支持向量机（Support Vector Machine, SVM）

机器学习实战（五）支持向量机SVM（Support Vector Machine）

支持向量机 Support Vector Machine （SVM）初步理解

支持向量机的公式推导(Support Vector Machine，SVM)

SVM 支持向量机(Support Vector Machine)算法

支持向量机(support vector machine)(SVM)(1)

机器学习python 支持向量机Support vectors machine (SVM算法)（线性可区分类一）

[机器学习] 分类 --- Support Vector Machine (SVM)

机器学习算法 --- SVM (Support Vector Machine)

监督学习——支持向量机（Support Vector Machine--SVM）

机器学习之支持向量机(Support Vector Machine)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)