1、Logistics Regression模型

1、线性可分VS线性不可分

  对于一个分类问题,通常可以分为线性可分与线性不可分两种 。如果一个分类问题可以使用线性判别函数正确的分类,则称该问题为线性可分。如图所示为线性可分,否则为线性不可分:

下图为线性不可分:

1.2、Logistics Regression模型

  Logistics Regression模型为广义的线性模型的一种,属于线性的分类模型。对于线性可分问题,需要找到一条直线,能够将两个不同的类分开,这条直线也称为超平面。对于上述超平面,可以使用如下的线性函数表示:

其中W为权重,b为偏置。若在多维的情况下,权重W和偏置b均为向量。在Logistic Regression算法中,通过对训练样本的学习,最终得到该超平面,将数据分成正负两个类别。此时可以使用阈值函数,将样本映射到不同的类别中,常见的阈值函数有Sigmoid函数,其形式如下:

                                                                  

Sigmoid函数的图像如图所示。

                             

从Sigmoid函数的图像可以看出,其函数值域为

                                           

猜你喜欢

转载自www.cnblogs.com/wanshuai/p/9086768.html