机器学习100天-多元线性回归 [代码实现细节分析] - 代码天地

机器学习100天-多元线性回归 [代码实现细节分析]

其他 2019-01-30 05:00:57 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/STILLxjy/article/details/86499056

原始数据：
在这里插入图片描述

（1）导入库

import pandas as pd
import numpy as np

（2）导入数据集：数据中存在值为0的丢失数据情况

dataset = pd.read_csv('50_Startups.csv')
X = dataset.iloc[ : , :-1].values
Y = dataset.iloc[ : ,  4 ].values

在这里插入图片描述

（3）数据预处理：
1:将丢失数据0使用平均值代替

from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 0, strategy = "mean", axis = 0)
imputer = imputer.fit(X[:,0:3])
X[:,0:3] = imputer.transform(X[:,0:3])

在这里插入图片描述
2:将类别数据数字化

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder()
X[: , 3] = labelencoder.fit_transform(X[ : , 3])

在这里插入图片描述
3:将类别数字转换为onehot类型

onehotencoder = OneHotEncoder(categorical_features = [3])
X = onehotencoder.fit_transform(X).toarray()

在这里插入图片描述
（4）躲避虚拟变量陷阱：丢弃第一列数据，他可以被其他属性预测

X = X[: , 1:]

在这里插入图片描述
（5）拆分数据集为训练集和测试集

from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.2, random_state = 0)

（6）在训练集上训练多元线性回归模型

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)

（7）在测试集上预测结果

y_pred = regressor.predict(X_test)

多元线性回归：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/STILLxjy/article/details/86499056

机器学习100天-多元线性回归 [代码实现细节分析]

100天机器学习(100-Days-Of-ML)day3多元线性回归及虚拟变量陷阱分析

【机器学习算法】【8】--多元线性回归分析理论详解

机器学习——多元线性回归分析（multiple regression）及应用

机器学习100天——实现简单线性回归(第二天)

机器学习4- 多元线性回归+Python实现

机器学习 | 机器学习100天(3) --- 多元线性回归

机器学习100天-数据预处理 [代码实现细节分析]

机器学习代码实现：多元线性回归（梯度下降法）吴恩达课后题目

机器学习基础学习-多元线性回归问题（梯度下降法实现）

机器学习基础学习-多元线性回归问题（数学解实现）

机器学习8/100天-Logistic回归原理与实现

机器学习第1天：线性回归（代码篇）

机器学习-多元线性回归及其手写实现梯度下降

学习机器学习100天系列_Day03_多元线性回归

机器学习基础100天---day03 多元线性回归

100天机器学习算法-Day3: 多元线性回归

100天机器学习（Day3）-Multiple_Linear_regression--多元线性回归

机器学习线性回归分析

线性回归模型机器学习代码实现

机器学习：线性回归与Python代码实现

【机器学习】线性回归+代码实现

机器学习算法代码实现——线性回归

三、机器学习算法学习---梯度下降法（6-3实现多元线性回归中的梯度下降法）

机器学习实现——线性回归

【机器学习】回归分析之线性回归

【机器学习】线性回归实战案例一：多元素情况下广告投放效果分析步骤详解

多元线性回归分析问题

多元线性回归分析问题

R多元线性回归分析

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)