引入披萨问题
回顾一下自己的生活经验,匹萨的价格其实还会受到其他因素的影响。
比如,匹萨的价格还与辅料有关。让我们再为模型增加一个解释变量。用一 元线性回归己经无法解决了,我们可以用更具一般性的模型来表示,即多元线性回归。
测试集
1.通过分析已经确定属于多元线性回归问题
完整代码为:
from sklearn import linear_model
# 1.准备 训练数据集
X_train = [[8,11],[9,8.5],[11,15],[16,18],[12,11]]
y_train = [[9.77],[10.75],[12.70],[17.58],[13.68]]
# 2.构建模型
model = linear_model.LinearRegression()
# 3.训练模型
model.fit(X_train,y_train)
print("模型系数为:",model.coef_) # 模型系数为: [[ 9.77014044e-01 -8.91512314e-04]
print("模型截距为:",model.intercept_) # 模型截距为: [1.96476491]
# 4.预测模型
y_train_pred = model.predict(X_train)
print(y_train_pred)
# [[ 9.77107063]
# [10.75031345]
# [12.69854671]
# [17.5809424 ]
# [13.67912681]]
# 准备 测试集
X_test = [[8,2],[9,0],[11,2],[16,2],[12,0]]
y_test = [[11],[8.5],[15],[18],[11]]
# 5.评估模型
score = model.score(X_test,y_test)
print("score:",score) # score: 0.6615073904189869
# 6.模型可靠,使用模型,正是预测
print(model.predict(X_test))
# [[ 9.77909424]
# [10.75789131]
# [12.71013637]
# [17.59520659]
# [13.68893344]]
细节分析:评估模型中score越接近1,说明模型拟合度越可靠,逼真
2.总结:
① 根据题意分析属于多元线性回归问题
② 导入回归模型库
③ 五步走:导入训练数据集 + 构建模型 + 训练模型 + 评估模型 + 模型预测