python机器学习—— 数据预处理 & 算法初步

物联网 2023-06-24 20:09:21 阅读次数: 0

目录

数据预处理
1.获取数据
2.处理缺失值
3.划分数据集
4.数据预处理和PCA降维
5.算法实现：估计器

在这里插入图片描述

数据预处理

1.获取数据

在这里插入图片描述

from sklearn.datasets import load_iris
li=load_iris()
print("获取特征值")
print(li.data)
print("目标值",li.target)#分类数据集

用于分类的大数据集

在这里插入图片描述

from sklearn.datasets import load_iris,fetch_20newsgroups
news=fetch_20newsgroups(subset="all")
print(news.data)
print(news.target)

from sklearn.datasets import load_boston
lb=load_boston()
print(lb.data)
print(lb.target)#回归数据集

2.处理缺失值

在这里插入图片描述

3.划分数据集

训练集与测试集划分：70% 30%；80% 20%；75% 25%
在这里插入图片描述

from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()##将数据集赋值给cancer变量
cancer_data = cancer['data']
cancer_target = cancer['target']
from sklearn.model_selection import train_test_split
cancer_data_train, cancer_data_test,cancer_target_train, cancer_target_test = \
train_test_split(cancer_data, cancer_target,test_size=0.2, random_state=42) # test_size表示测试集在总数中的占比

4.数据预处理和PCA降维

在这里插入图片描述

#离差标准化
from sklearn.preprocessing import MinMaxScaler
Scaler = MinMaxScaler().fit(cancer_data_train) ##生成规则
##将规则应用于训练集
cancer_trainScaler = Scaler.transform(cancer_data_train) 
##将规则应用于测试集
cancer_testScaler = Scaler.transform(cancer_data_test)

在这里插入图片描述

from sklearn.decomposition import PCA
pca_model = PCA(n_components=10).fit(cancer_trainScaler) ##生成规则
cancer_trainPca = pca_model.transform(cancer_trainScaler) ##将规则应用于训练集
cancer_testPca = pca_model.transform(cancer_testScaler) ##将规则应用于测试集

5.算法实现：估计器

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Pireley/article/details/131362333

python机器学习—— 数据预处理 & 算法初步

机器学习-数据预处理（Python实现）

python 机器学习之数据预处理

Python机器学习之数据预处理

机器学习数据预处理

机器学习--数据预处理

数据预处理-机器学习

机器学习 —— 数据预处理

机器学习—数据预处理

机器学习：数据预处理

python学习算法初步数据结构

数据预处理初步解释

算法-数据预处理

从零开始数据科学与机器学习算法-数据预处理与基准模型-01

学习数学建模算法与应用【数据预处理】

【机器学习】Python数据预处理（1）异常值处理

100天机器学习算法-Day1: 数据预处理

通过Ti-One机器学习平台玩转2020腾讯广告算法大赛：数据预处理

用机器学习基本算法分类手机数据-预处理篇

Python数据预处理

学习数据预处理

【我的python机器学习之路·1】数据预处理

python机器学习：：数据预处理（1）【转】

Python机器学习（七十四）Keras 预处理数据

机器学习之数据预处理

机器学习-常见的数据预处理

机器学习sklearn—数据的特征预处理

机器学习中数据预处理的方式

机器学习初探---数据预处理

【机器学习】数据预处理与特征工程

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)