机器学习 | 机器学习100天(3) --- 多元线性回归 - 代码天地

机器学习 | 机器学习100天(3) --- 多元线性回归

其他 2019-01-29 20:01:05 阅读次数: 0

机器学习100天系列学习笔记基于机器学习100天(中文翻译版),机器学习100天(英文原版）

所有代码使用iPython Notebook实现

目录

1.数据预处理

2.在训练集上训练多元线性回归模型

3.在测试集上预测结果

实验综述

1.数据预处理

'''1.导入相关库'''
import pandas as pd
import numpy as np

'''2.导入数据集'''
data = pd.read_csv('50_Startups.csv')
print(data.head())
#分离特征矩阵X和标签向量Y
X = data.iloc[:,:-1].values
Y = data.iloc[:,-1].values

'''3.检查缺失数据'''
#没有缺失数据

'''4.解析分类数据'''
#将类别数据数字化
from sklearn.preprocessing import LabelEncoder,OneHotEncoder
labelencoder = LabelEncoder()
#第3个特征State是类别数据 需要数字化
X[:,3] = labelencoder.fit_transform(X[:,3])
#对第3个特征State数字化后 采用one-hot编码
onehotencoder = OneHotEncoder(categorical_features=[3])
X = onehotencoder.fit_transform(X).toarray()

'''5.躲避虚拟变量陷阱'''
#one-hot编码 向量第一分量值 = 1-向量其他分量值之和
#可以去掉第一个特征(one-hot向量的第一个分量)
X = X[:,1:]

'''6.分割数据集为训练集和测试集'''
from sklearn.model_selection import train_test_split
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.2,random_state=0)

'''7.特征缩放'''
#使用线性回归模型训练或预测时  会有相关库自动进行特征缩放

2.在训练集上训练多元线性回归模型

from sklearn.linear_model import LinearRegression

regressor = LinearRegression() #实例化线性回归类的对象
regressor = regressor.fit(X_train,Y_train) #使用实例化的对象调用类中的fit方法 返回训练好的对象/模型

3.在测试集上预测结果

#使用训练好的对象/模型调用类中的predict方法 进行预测 返回预测值
y_pred = regressor.predict(X_test)

猜你喜欢

转载自blog.csdn.net/sdu_hao/article/details/86416874

机器学习 | 机器学习100天(3) --- 多元线性回归

机器学习－－多元线性回归

机器学习多元线性回归

机器学习——Day 3 多元线性回归

机器学习回归篇-多元线性回归

机器学习第3天：多元线性回归

100天机器学习算法-Day3: 多元线性回归

100天机器学习（Day3）-Multiple_Linear_regression--多元线性回归

机器学习（4）-多元线性回归

机器学习之多元线性回归

matlab 机器学习多元线性回归

机器学习5（多元变量线性回归）

机器学习（2）--多元线性回归算法

机器学习sklearn（2）多元线性回归

机器学习（8）-- 多元线性回归

机器学习笔记（二）多元线性回归

机器学习多元线性回归模型推导

机器学习（五）多元线性回归

机器学习基础-多元线性回归-02

机器学习算法--多元线性回归模型

机器学习——多元线性回归模型

机器学习算法基础——多元线性回归

机器学习10—多元线性回归模型

机器学习(5) 多元线性回归

机器学习---线性回归、多元线性回归、代价函数

100天机器学习(100-Days-Of-ML)day3多元线性回归及虚拟变量陷阱分析

学习机器学习100天系列_Day03_多元线性回归

机器学习（多元线性回归模型&逻辑回归）

机器学习回归篇（1）——多元线性回归

机器学习基础100天---day03 多元线性回归

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)