对于二分类问题,回归模型中只有1-0两种取值(如是和否、发生不发生)假设在p个独立自变量 x 1 x_1 x1、 x 2 x_2 x2、 x 3 x_3 x3… x p x_p xp作用下,记y取1的概率为 p = P ( y = 1 ∣ X ) p=P(y=1|X) p=P(y=1∣X),取0的概率为 1 − p 1-p 1−p,取1和取0的概率之比为 p 1 − p \frac{p}{1-p} 1−pp,称为事件的优势比odds,对优势比取对数,可得: L o g i t ( p ) = l n ( p 1 − p ) Logit(p)=ln(\frac{p}{1-p}) Logit(p)=ln(1−pp),则 p = 1 1 + e − z p=\frac{1}{1+e-z} p=1+e−z1即为Logistic函数
1.4 案例操作
import pandas as pd
from sklearn.linear_model import LogisticRegression as LR
filename = r"..\data\bankloan.xls"
data = pd.read_excel(filename)
x= data.iloc[:,:8].values
y = data.iloc[:,8].values
lr = LR()
lr.fit(x,y)print('模型的平均准确度为:%s'%lr.score(x,y))