机器学习-第五次作业-线性回归算法

1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性

1)这节课主要讲的是机器学习中的监督学习的回归算法。

2)回归算法用于连续分布预测,在给定输入的时候预测出一个数值。

 

3)监督学习中回归和分类的区别。回归是连续变量预测,分类是离散变量预测。

 

4)线性回归的定义、线性方程

 

5)矩阵和数组满足了线性回归的需求

 

6)损失函数是依据我们的训练集,选取最优的θ,在我们的训练集中让h(x)尽可能接近真实的值。h(x)和真实的值之间的差距,我们定义了一个函数来描述这个差距,这个函数称为损失函数,表达式如下:

这里的这个损失函数就是著名的最小二乘损失函数。

7)本节总结

 

2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)

线性回归对大量的观测数据进行处理,从而得到比较符合事物内部规律的数学表达式。也就是说寻找到数据与数据之间的规律所在,从而就可以模拟出结果,也就是对结果进行预测。解决的就是通过已知的数据得到未知的结果。例如:对房价的预测、判断信用评价、电影票房预估、电视连续剧的收视等。

3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)

#案列:运用线性回归算法预测波士顿房价
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
data = load_boston()
data_all = data['data']
x = data_all[:, 5:6]
y = data['target']
model_LR = LinearRegression()
model_LR.fit(x, y)
pre = model_LR.predict(x)
#使用可视化的方式对比拟合出的线性回归方程与真实房价的分布情况
plt.scatter(x, y) #真实房价的分布
plt.plot(x, pre, c='r') #拟合出的线性回归方程
plt.legend(['real', 'pre'])
plt.show()

猜你喜欢

转载自www.cnblogs.com/sunxx428/p/12737810.html
今日推荐