线性回归-最小二乘-diabetes - 代码天地

线性回归-最小二乘-diabetes

其他 2019-07-05 16:21:47 阅读次数: 0

数据集：https://scikit-learn.org/stable/datasets/

特征：

age 年龄

sex 性别

bmi 体质指数

bp 血压

s1,s2,s3,s4,s4,s6 六种血清的化验数据

标签：

value 一年后疾病进展的量化指标

一、加载库

import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib as mpl
import matplotlib.pyplot as plt
# 设置字体为黑体，以支持中文显示。
mpl.rcParams["font.family"] = "SimHei"
# 设置在中文字体时，能够正常的显示负号（-）。
mpl.rcParams["axes.unicode_minus"] = False

二、数据预处理

# 加载数据集
data = pd.read_csv(r"diabetes.csv",header=0)
#data.sample(30)
#data.info()
# 查看是否含有异常值
#data.describe()
# 检查是否包含重复值
#data.duplicated().any()
# 如果有重复值，可以这样去除重复值
# data.drop_duplicates(inplace=True)

三、调用方法

# 将加载的数据集分为特征X与标签y。
X, y = data.iloc[:, :-1], data.iloc[:, -1]
#通过train_test_splil将数据分为训练集、测试集，测试集占0.25的比例
train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.25, random_state=0)
#display(len(train_y))
#display(len(test_y))

#实例化线性回归模型
lr=LinearRegression()
#训练模型
lr.fit(train_X,train_y)
#传入测试集进行测试
result=lr.predict(test_X)
#对模型进行评估

display(result)
display(test_y.values)
# 均方误差
print("Mean squared error: %.2f" % mean_squared_error(test_y, result))
# 方差分数: 1代表完美预测
print('Variance score: %.2f' % r2_score(test_y, result))

四、结果可视化

plt.figure(figsize=(15, 10))
# 绘制预测值
plt.plot(result, "ro-", label="预测值")
# 绘制真实值
plt.plot(test_y.values, "go--", label="真实值")
plt.title("线性回归预测-最小二乘")
plt.xlabel("样本序号")
plt.ylabel("一年后疾病值")
plt.legend(loc="best")
plt.show()

猜你喜欢

转载自blog.csdn.net/weixin_42295205/article/details/91618650

线性回归-最小二乘-diabetes

线性回归与最小二乘

机器学习（回归一）——线性回归-最小二乘

线性回归为什么选择最小二乘

线性回归的常用求解方法之最小二乘法（二）：最小二乘回归的数据计算意义

机器学习（回归二）——线性回归-最小二乘-代码实现

偏最小二乘回归

偏最小二乘回归分析

偏最小二乘回归模型

从对最小二乘做线性回归的正则化，逐渐延伸至ElasticNet回归

【线性回归】最小二乘与岭回归的概率论解释

线性回归，最小二乘，局部加权，岭回归，huberloss

Google Earth Engine（GEE）——sentinel1线性趋势分析（线性最小二乘回归）

线性最小二乘问题

非线性最小二乘

线性回归的损失函数为什么用最小二乘不用似然函数？

【机器学习详解】线性回归、梯度下降、最小二乘的几何和概率解释

用梯度下降求解最小二乘线性回归python实现

奇异值分解与最小二乘问题线性回归

【机器学习算法】基于最小二乘损失(MSE)的多元线性回归解析解推导

机器学习之最小二乘线性回归原理解读与公式推导

最小二乘回归矩阵形式 --岭回归

最小二乘

线性回归-最小二乘法

线性回归与最小二乘法

线性回归（最小二乘法）

线性回归——最小二乘法

线性回归(最小二乘法)

最小二乘法及线性回归

最小二乘法，回归，线性回归，Logistic回归

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)