SVM超平面的理解

                                         超平面的理解

超平面的定义

    超平面是n维欧氏空间中(n-1)维度的子空间,例如3维空间的“超平面”就是一个面,但通常超过3维空间之后我们才称之为超平面,是纯粹的数学概念,不是现实的物理概念。公式表示为1-1,W、x是一个向量,b是一个标量。W是超平面的法向量,b是偏移量,决定了超平面到原点的距离!(等下解释)

                                                                     W^{T}x+b=0                    (1-1)

  公式理解:

              为什么1-1方程可以表示一个与W长度相等的维度的超平面啦?如一个三维平面可以表示为Ax+By+cz+D=0。当d=0,即超平面到原点的距离为0时,即W^{T}x=0 。由于W、x都是一个到原点的向量,两个向量内积为零则垂直所以可以将x的集合限定到w垂直且过原点的平面,由此W^{T}x=0确定了唯一一个W长度相等的维度的超平面,所以W是与x所在平面的法向量。加b即y向上偏移。

超平面一定过原点

百度百科对于超平面的定义,“”因为是子空间,所以超平面一定经过原点。”

为什么超平面一定经过原点?

线性子空间定理1.4.1 数域P上线性空间V的非空子集W是V的一个线性子空间当且仅当W对于V的两种运算封闭,即

(1)如果α,β∈W,则α+β∈W;

(2)如果k∈P,α∈W,则kα∈W;                                                                                                                                        

如果取k=0,根据(2)可以得到0α=0∈ W ,所以零向量属于V的任何一个线性子空间。

但是每个线性空间子空间的维度降低他的零向量与原线性空间的原点还是一样吗?(待解决,有大佬知道麻烦求解)

点到超平面的距离

        样本空间中的任意一点 x,到超平面(w,b)的距离,可以表示为

                                                    

      后来有同学评论说,点到超平面上的点为什么这么计算呢?我在这里再具体说一下。推导过程并不繁琐(这里以三维空间为例)。

      对于超平面A,假设 x‘ 为超平面上任意一点,那么,显然满足:

                                           

对于空间上任意一点 x, 到平面 A  的距离 H,等于 x 到超平面的法向量长度,也就是 向量 xx' 在垂直方向上(即法向量)上的投影。而计算投影,将 xx' 乘以法向量 w 即可。并且,我们不光要投影,还要计算单位,即使用单位为 1 的投影。也就是在分母除以 || w ||。所以,距离 H 可以表示为:

                                      

又因为:

                                               

所以,距离为:

                    

判断超平面的正反

        一个超平面可以将它所在的空间分为两半, 它的法向量指向的那一半对应的一面是它的正面, 另一面则是它的反面。如果利用数学来判断的话,需要利用到法向量 w。

                                          

        若将距离公式中分子的绝对值去掉, 让它可以为正为负. 那么, 它的值正得越大, 代表点在平面的正向且与平面的距离越远. 反之, 它的值负得越大, 代表点在平面的反向且与平面的距离越远。

发布了46 篇原创文章 · 获赞 43 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/wangxiaai/article/details/81632882
今日推荐