机器学习简述

目录

1. 多项式回归

2. 训练和测试

3. 多元回归

多项式回归

  • 如果您的数据点显然不适合线性回归(穿过数据点之间的直线),那么多项式回归可能是理想的选择。

  • 像线性回归一样,多项式回归使用变量 x 和 y 之间的关系来找到绘制数据点线的最佳方法。

  • Python 有一些方法可以找到数据点之间的关系并画出多项式回归线。我将向您展示如何使用这些方法而不是通过数学公式。
    举个例子吧!

  • polyfit(x,y,p) 返回由x,y构建的多项式系数

  • poly1d(reg) reg指多项式系数,来构建一个函数

  • polyvall(reg,x)传入多项式系数和x,来计算y

import matplotlib.pyplot as plt
import numpy as np

# 构建噪声数据xu,yu
xu = np.random.rand(50) * 4 * np.pi - 2 * np.pi


def f(x):
    return np.sin(x) + 0.5 * x


yu = f(xu)

plt.figure(figsize=(8, 4))
# 用噪声数据xu,yu,得到拟合多项式系数,自由度为5
reg = np.polyfit(xu, yu, 5)
# 计算多项式的函数值。返回在x处多项式的值,p为多项式系数,元素按多项式降幂排序
# ry = np.polyval(reg, xu)  这行代码与下两行代码作用相同
a = np.poly1d(reg)
ry = a(xu)
# 原先函数绘制
plt.plot(xu, yu, 'b^', label='f(x)')
# 拟合绘制
plt.plot(xu, ry, 'r.', label='regression')
plt.legend(loc=0)
plt.show()

在这里插入图片描述

训练和测试

什么是训练/测试
训练/测试是一种测量模型准确性的方法。

之所以称为训练/测试,是因为我们将数据集分为两组:训练集和测试集。

80% 用于训练,20% 用于测试。

您可以使用训练集来训练模型。

您可以使用测试集来测试模型。

训练模型意味着创建模型。

测试模型意味着测试模型的准确性。

多元回归

import pandas
from sklearn import linear_model
# 读取exl文件
df = pandas.read_csv("cars.csv")
# 多个独立的自变量 列变量
X = df[['Weight', 'Volume']]
# 因变量 列变量
y = df['CO2']
# 创建一个线性回归对象
regr = linear_model.LinearRegression()
# 将X,y作为参数,填充该线性回归对象
regr.fit(X, y)
# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量:
predictedCO2 = regr.predict([[2300, 1300]])
print(predictedCO2)

猜你喜欢

转载自blog.csdn.net/qq_62118538/article/details/121913843
今日推荐