线性可分,线性模型

线性可分和线性不可分

线性可分指的是可以用一个线性函数将两类样本分开(注意这里是线性函数),比如在二维空间中的直线,三位空间中的平面以及高维空间中的超平面。这里指的可分是没有一丝误差的分开,线性不可分指的就是部分样本用线性分类面划分时会产生分类错误的现象。
在这里插入图片描述

线性模型

乘法式子中自变量x前的系数w,如果一个w只影响一个x,那么这个模型就是线性模型,如 y = w 0 + w 1 ∗ x y=w_0 + w_1*x y=w0+w1x
当需要拟合 y = w 0 + w 1 ∗ x + w 2 ∗ x 2 y=w_0+w_1*x+w_2*x^2 y=w0+w1x+w2x2时,可将 x 2 x^2 x2替换为 z z z,即利用升维,将一个多项式回归模型变为线性回归模型。

判断数据是否线性可分

凸包就是一个刚好包住了所有的数据的凸的闭合曲线(曲面)。
在这里插入图片描述
检查凸包(convex hull)是否相交,可以作为判断数据是否线性可分的依据。

  1. 用quickhull算法来找到数据的凸包

  2. sweepline算法判断凸包边缘是否有相交

     两个步骤的复杂度都是O(nlogn)
    

其中quickhull已经在软件包qhull(http://www.qhull.org/)实现了。

未完待续。。。

猜你喜欢

转载自blog.csdn.net/weixin_42764932/article/details/111357865
今日推荐