SVM 模型选择与超参数优化方法

作者:禅与计算机程序设计艺术

1.简介

什么是支持向量机(Support Vector Machine,SVM)?SVM 是一种二分类算法,它通过找到一个最优分离超平面(separating hyperplane),将数据点分为两类,使得两类中的数据点尽可能地远离对方。换句话说,SVM 的目的是找到能够最大化间隔(margin)的超平面,使得数据集中处于不同类别的数据点之间的距离最大。间隔最大化可以理解为 SVM 对异常值和噪声点非常敏感。

与其他机器学习模型相比,SVM 在数据集较小、特征维度较高、存在不少噪声样本时表现尤佳。然而,它的模型复杂度很高,在某些情况下,即使使用核函数转换为线性不可分时,依然不能满足求解条件。因此,如何更好地选择并调参 SVM 来提升模型性能是当前面临的问题。

本文将从以下几个方面介绍 SVM 模型选择与超参数优化方法:

  1. 支持向量机模型选择
  2. 软间隔与硬间隔
  3. 拟合误差的度量
  4. 正则化方法
  5. 交叉验证方法
  6. 超参数优化方法

2. 支持向量机模型选择

2.1.模型概述

SVM 是一种二分类模型,其基本思想是寻找一个超平面将数据点分到不同的两组。通过寻找最大间隔(margin)来实现这一目标。当数据点的特征空间内存在多个超平面时,根据间隔大小选择最优的那个作为分界线,称之为支撑向量机(support vector machine)。

然而,SVM 模型存在以下几种常见形式:</

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132256031
svm