《统计学习方法》笔记--支持向量机 - 代码天地

《统计学习方法》笔记--支持向量机

其他 2019-11-03 23:50:51 阅读次数: 0

支持向量机（support vector machines ,SVM)是一种定义在特征空间上的间隔最大的二类分类模型。

线性可分支持向量机

假定特征空间上的训练数据集，其中，支持向量机的学习目标是找到一个超平面将训练数据集分为两个部分，并且是数据集中的点到这个超平面的几何间隔最大。

至此，支持向量机的线性学习可转化为以下的最优化问题：

例子：如下图1-1中的训练数据集，正例点是，，负例点是，试求最大间隔分离超平面。

图1-1 间隔中最大分离超平面示例

解：根据训练集构造约束条件最优化问题：

由此解得使间隔最大化的超平面为：，其中和为支持向量（训练数据集中与分离超平面距离最近的样本点的实例）。对应的决策函数为：。

为了求解线性可分支持向量机的最优化问题，应用拉格朗日对偶，将上述的原始最优化问题转化为通过求解对偶问题得到最优解，这种转化为通过对偶问题求解可使得其最优解更容易被求得，也使得其更容易引入核函数，进而推广到非线性的分类问题上。

引入拉格朗日乘子得：

据拉格朗日对偶性，原始问题对偶问题是极大极小问题：

首先求，即将拉格朗日函数分别对求偏导数并令其为0，然后将求得的结果代回，得：

再求对的极大化，等价于目标函数的负值对的极小化，即是对偶问题：

假设经过计算得到是这对偶问题的最优解，则

并选择中的一个正分量，计算

进而得分离超平面为：，分类决策函数：

线性支持向量机

上述的支持向量机是在线性可分的基础条件上得出，而实际中，训练数据集中往往会存在一些噪点使得数据集不是线性可分的，对此需要对上述的支持向量机做出一些修改，即增加正则化项，将硬间隔化为软间隔，使得其也能够支持线性不可分的情况。

具体地，为每一个样本引入松弛变量和一个大于0的惩罚参数，那么线性不可分的线性支持向量机的学习问题变成凸二次规划问题：

同样，将上述的问题转换为对偶问题：

接下来的求最优解的步骤与上面的可线性划分支持向量机的相似。

假设经过计算得到是这对偶问题的最优解，则

并选择中的一个分量，（这里选择分量与上面的区别开）计算

进而得分离超平面为：，分类决策函数：

非线性支持向量机

对于非线性可分的问题，则利用核技巧，将非线性分类问题变换为线性分类问题。（核技巧的基本思想是通过一个非线性变换将输入空间对应于另一个特征空间，使得输入空间中的超曲面模型对应于特征空间中的超平面）

将线性支持向量机中对偶问题目标函数的内积用内核来代替，而求最优解的步骤与上面的线性支持向量机的类似：

假设经过计算得到是这对偶问题的最优解，选择中的一个分量，（这里选择分量与上面的区别开）计算

进而得分离超平面为：，分类决策函数：

猜你喜欢

转载自www.cnblogs.com/lincz/p/11789882.html

《统计学习方法》笔记--支持向量机

《统计学习方法》笔记七（2）支持向量机——线性支持向量机

支持向量机学习（一）·统计学习方法

统计学习方法_支持向量机SVM实现

李航《统计学习方法》-----支持向量机

统计学习方法——支持向量机

统计学习方法（六）支持向量机

统计学习方法之支持向量机

统计学习方法7 -支持向量机

机器学习入门之《统计学习方法》笔记整理——支持向量机

《统计学习方法（李航）》支持向量机学习笔记

统计学习方法学习笔记（三）：支持向量机（上）

统计学习方法学习笔记（四）：支持向量机（中）

统计学习方法笔记（十一）支持向量机一

统计学习方法笔记（十一）支持向量机（三）

统计学习方法笔记（十一）支持向量机（二）

【统计学习方法-李航-笔记总结】七、支持向量机

《统计学习方法》第七章: 支持向量机读书笔记

统计学习方法读书笔记（七）-支持向量机

统计学习方法——第7章支持向量机（个人笔记）

【统计学习笔记】支持向量机

李航《统计学习方法》——第七章支持向量机

《统计学习方法》第 7 章“支持向量机”导读

统计学习方法ｃ++实现之六支持向量机（SVM）及SMO算法

统计学习方法C++实现之六支持向量机（SVM）

李航《统计学习方法》第七章支持向量机习题答案

李航-《统计学习方法》第七章支持向量机

【统计学习方法】支持向量机(SVM) Python实现

《统计学习方法》第七章支持向量机

数据矿工学习-《统计学习方法》思维导图7.1-线性可分支持向量机

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)