机器学习之SVM软间隔模型、核函数 - 代码天地

机器学习之SVM软间隔模型、核函数

其他 2018-06-20 05:15:18 阅读次数: 3

SVM的软间隔（soft margin）模型

当线性数据集中存在少量的异常点，导致数据集不是线性可分，或者即使恰好找到某个核函数使得训练集在特征空间中线性可分，也很难断定这个结果是不是由于过拟合所造成的。解决方法之一是允许SVM在一些样本上分错，因此引入软间隔的概念来解决此类问题。

硬间隔：要求所有样本满足约束，函数距离大于等于1；

软间隔：允许某些样本不满足约束y⁽ⁱ⁾(w^Tx⁽ⁱ⁾+b)≥1，对于训练集中的每个样本都引入一个松弛变量ξ_i≥0，使得函数距离加上松弛变量后的值大于等于1。松弛变量越大，表示样本点离超平面越近，如果松弛变量大于1，那么表示允许该样本点被分错，目标函数转换为：

其中C>0是超参惩罚参数，C越大表示对误分类的惩罚越大，即允许分错的样本越少。C值的给定需要调参。

同线性可分SVM，构造软间隔最大化的约束问题对应的Lagrange函数如下：

优化目标函数与其对偶问题为：

；

再对上式求α的极大值，即得对偶问题：

软间隔SVM的KKT条件：

根据KKT条件中的对偶互补条件 α(y(w^Tx+b)-1+ξ)=0 可知α_i>0的样本为支持向量，软间隔模型的支持向量的位置根据α_j、ξ_j不同的取值，有可能落在间隔边界上、或者在间隔边界与分离超平面之间、或者在超平面误分一侧：

（1）α_j<C、μ_j>0，则ξ_j=0，支持向量x_j恰好落在间隔边界上；

（2）α_j=C，0<ξ_j<1，则分类正确，x_j在间隔边界与分离超平面之间；

（3）α_j=C，ξ_j=1，则x_j在分离超平面上；

（4）α_j=C，ξ_j>1，则x_j位于分离超平面误分一侧。

SVM软间隔模型的算法流程

设m个线性可分的样本数据{(x⁽¹⁾,y⁽¹⁾),(x⁽²⁾,y⁽²⁾),...,(x^(m),y^(m))}，y→{-1,+1}

选择一个惩罚系数C>0，构造约束优化问题：

使用SMO算法求出最优解α*；

找出所有的支持向量集合S，支持向量对应的α_j>0：

更新参数w^*，b^*的值，求b^*时等号两边同时乘以支持向量的类标签：

构建最终的分类器：

SVM软间隔模型总结

可以解决线性数据中携带异常点的分类模型构建问题；

通过引入惩罚项系数及松弛变量，可以增加模型的泛化能力，健壮性好；

如果给定的惩罚项系数C越小，在模型构建的时候就允许存在越多分类错误的样本，也就是表示此时模型的准确率比较低；如果给定的C越大，表示在模型构建的时候，允许分类错误的样本越少，也就表示此时模型的准确率比较高。

非线性可分SVM

当数据不是线性可分时，使用核技巧（kernel trick）对数据集进行非线性变换，将非线性问题变为线性问题，从而可以使用线性可分SVM模型或者软间隔线性可分SVM模型求解原来的非线性问题。

核函数

设χ是输入空间，H为特征空间（高维/无穷维），如果存在一个从χ到H的映射

ϕ(x): χ→H

使得对所有x,z∈χ，函数K(x,z)满足条件

K(x,z)=ϕ(x)·ϕ(z)

则称K(x,z)为核函数，ϕ(x)为映射函数。

核函数在解决线性不可分问题的时候，采取的方式是：只定义核函数K(x,z)，而不显式地定义映射函数ϕ，通常直接计算K(x,z)比较容易，而通过ϕ(x)和ϕ(z)的内积计算K(x,z)并不容易。

在线性SVM的对偶问题中，目标函数和最终分类器只涉及输入实例与实例之间的内积，因此可以用核函数来代替直接求内积的方法，使用低维空间上的计算避免在高维特征空间中向量内积的很大的计算量。

常用核函数的种类有

线性核函数：

多项式核函数：其中γ、c、d属于超参，需要调参定义

高斯核函数（径向基核函数RBF）：其中σ、γ>0为超参

拉普拉斯核函数：

Sigmoid核函数：

核函数总结

可以自定义核函数，条件是必须为正定核函数，即K(x,z)对应的Gram矩阵K=[K(x_i,x_j)]_m*m是半正定矩阵（统计学习方法P121）；

核函数的价值在于：虽然也是将特征从低维映射到高维，但事先在低维上进行计算，而将实质上的分类效果表现在了高维上，避免了直接在高维空间中的复杂计算

通过核函数，可以将非线性可分的数据转换为线性可分的数据。

高斯核公式的证明

令z=x，那么进行多为变换后，应该是同一个向量，从而可以得到以下公式：

对第三项进行Taylor展开，得到：

猜你喜欢

转载自blog.csdn.net/liuy9803/article/details/80721705

机器学习之SVM软间隔模型、核函数

传统机器学习(七)支持向量机(1)超平面、SVM硬间隔、软间隔模型和损失函数

机器学习算法SVM之核函数

支持向量机 (二)：软间隔 svm 与核函数

SVM(支持向量机)、核函数、软间隔、SMO算法

机器学习——SVM核函数

核函数、软间隔分类器、坐标上升法、SMO算法以及SVM的一些应用-机器学习公开课第八讲

机器学习-SVM硬间隔与软间隔：重要参数C

斯坦福CS229机器学习笔记-Lecture8- SVM支持向量机之核方法 + 软间隔 + SMO 算法

一文全解经典机器学习算法之支持向量机SVM（关键词：SVM，对偶、间隔、支持向量、核函数、特征空间、分类）

机器学习之支持向量机SVM Support Vector Machine (二) 非线性SVM模型与核函数

机器学习实战-之SVM核函数与案例

【机器学习】12：支持向量机原理2：软间隔与核函数处理方法

07 SVM - 软间隔模型

机器学习之支持向量机SVM Support Vector Machine (一) 线性SVM模型与软硬间隔

机器学习：支持向量机SVM-软间隔

机器学习_SVM_核函数的选择

机器学习-SVM-核函数

机器学习：SVM（核函数、高斯核函数RBF）

【机器学习】SVM之Hinge Loss，从LR到SVM，SVM核函数进一步理解

SVM学习——核函数

08 SVM - 软间隔模型算法流程

机器学习：SVM、软间隔、随机梯度下降SVM线性算法

机器学习之核函数

机器学习：SVM核函数的优势和缺陷

机器学习 - 2 -SVM核函数 - 20201123 -HK

【机器学习】SVM核方法

svm硬间隔与软间隔

机器学习 - 支持向量机（2）- 线性 SVM（软间隔最大化）

《机器学习_07_02_svm_软间隔支持向量机》

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)