机器学习2-支持向量机(Support Vector Machine)

  在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。
  介绍
  在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。给定一组训练样本,每个标记为属于两类,一个SVM训练算法建立了一个模型,分配新的实例为一类或其他类,使其成为非概率二元线性分类。一个SVM模型的例子,如在空间中的点,映射,使得所述不同的类别的例子是由一个明显的差距是尽可能宽划分的表示。新的实施例则映射到相同的空间中,并预测基于它们落在所述间隙侧上属于一个类别。
除了进行线性分类,支持向量机可以使用所谓的核技巧,它们的输入隐含映射成高维特征空间中有效地进行非线性分类。

举例说明
现在有一些数据,通过gui’n2,数据在坐标轴上的分布如下:
数据分布图
从上面的分布图可以看出,数据大概分为两类,红色的点和绿色的×,现在要使用这些数据训练出来一个模型,来进行预测新数据的出现的位置。可能上面的图形很难去画出一条边界来划分两个类别。但是如果我们采用一个SVM的模型X²+Y²,这样就会出现下图:
SVM模型整理后

从上面图可以看到,两类数据,进行模型转换后,数据可以济宁分类划分。这个就是最基础的向量机应用,我们可以根据不同的数据集来自定义自己的向量机模型(类似x²+y²)

总结

我们通常希望分类的过程是一个机器学习的过程。这些数据点是n维实空间中的点。我们希望能够把这些点通过一个n-1维的超平面分开。通常这个被称为线性分类器。有很多分类器都符合这个要求。但是我们还希望找到分类最佳的平面,即使得属于两个不同类的数据点间隔最大的那个面,该面亦称为最大间隔超平面。如果我们能够找到这个面,那么这个分类器就称为最大间隔分类器。

猜你喜欢

转载自blog.csdn.net/lansus/article/details/80746070