基于PCA的数据降维（鸢尾花（iris）数据集） - 代码天地

基于PCA的数据降维（鸢尾花（iris）数据集）

编程语言 2023-06-05 05:59:22 阅读次数: 0

目录

一、数据集

二、PCA降维

1）加载数据集

2）PCA降维过程

3）可视化降维效果

三、运行效果图

一、数据集

鸢尾花数据集是 Python 中 sklearn 库自带的数据集。数据本身是四维数据集，这里采用数据降维技术将数据降至二维，以便更好地可视化数据特征。

二、PCA降维

1）加载数据集

首先加载高维数据集（维度为4），并确定降维后空间维度n_components(维度为2）。

from sklearn.datasets import load_iris
data = load_iris()
y = data.target
x = data.data
n_components = 2

2）PCA降维过程

执行PCA算法进行降维操作，得到降维后的向量reduce_x。

from sklearn.decomposition import PCA
pca = PCA(n_components = n_components)
reduced_x = pca.fit_transform(x)

3）可视化降维效果

由于数据集已经进行了预定义为三类，为了有效区分不同类型之间特征以及同类别间的联系，将在二维空间进行可视化操作。

import matplotlib.pyplot as plt
red_x,red_y = [],[]
blue_x,blue_y = [],[]
green_x,green_y = [],[]

for i in range(len(reduced_x)):
    if y[i] == 0:
        red_x.append(reduced_x[i][0])
        red_y.append(reduced_x[i][1])
        
    elif y[i] == 1:
        blue_x.append(reduced_x[i][0])
        blue_y.append(reduced_x[i][1])
        
    else:
        green_x.append(reduced_x[i][0])
        green_y.append(reduced_x[i][1])
    
plt.scatter(red_x,red_y,c='r',marker='x',label='Class1')
plt.scatter(blue_x,blue_y,c='b',marker='D',label='Class2')
plt.scatter(green_x,green_y,c='g',marker='.',label='Class3')

三、运行效果图

可以清晰地看到三类数据被分割，且 Class1 与 Class2 和 Class3 差别明显。这证明了PCA降维的确提取出了重要特征，并且这种特征可以更好地区分数据，从而避免了数据集的“高维灾难”。

猜你喜欢

转载自blog.csdn.net/weixin_51756038/article/details/130058265

基于PCA的数据降维（鸢尾花（iris）数据集）

numpy实现鸢尾花数据集PCA降维

PCA降维--两种实现 : SVD或EVD. 强力总结. 在鸢尾花数据集(iris)实做

ML之DR：基于鸢尾花(Iris)数据集利用多种降维算法(PCA/TSVD/LDA/TSNE)实现数据降维并进行二维和三维动态可视化应用案例

用PCA对鸢尾花数据集降维并可视化

iris 鸢尾花数据集

鸢尾花(iris)数据集

LDA算法实现鸢尾花数据集降维

DS：基于鸢尾花数据集利用多种数据降维技术(PCA、SVD、MDS、LDA、T-SNE)实现三维可视化

基于LDA与PCA算法的鸢尾花数据集二维投影比较

sklearn数据集——iris鸢尾花数据集

sklearn iris(鸢尾花)数据集应用

Iris(鸢尾花) 数据集-机器学习入门

15 鸢尾花(iris)数据集分析

SVM线性分类——鸢尾花Iris数据集

LibSVM与鸢尾花Iris数据集（决策树）

鸢尾花数据集降维后高维数据可视化

机器学习基于IRIS鸢尾花数据集进行聚类分析

【实验练习】基于SVM的实现鸢尾花(Iris)数据集分类 (Python实现)

鸢尾花数据集

Python实现Iris数据集（鸢尾花卉数据集）kmeans聚类

基于SVM的鸢尾花数据集不同特征的分类

基于鸢尾花数据集的逻辑回归分类

基于SVM的鸢尾花数据集回归分析

R语言鸢尾花iris数据集的层次聚类分析

Spark MLlib - Iris（鸢尾花卉）数据集 LogisticRegression（逻辑回归）

原生Python实现KNN算法，并用鸢尾花(iris)数据集测试

作业：利用XGBoost实现对鸢尾花数据集（Iris.csv）的分类预测

支持向量机&鸢尾花Iris数据集的SVM线性分类练习

对鸢尾花Iris数据集进行SVM线性分类练习

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)