机器学习15-特征降维PCA

其他 2018-08-18 02:58:37 阅读次数: 0

code

import pandas as pd
import numpy as np
from sklearn.decomposition import PCA
from matplotlib import pyplot as plt

digits_train = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tra', header=None)
digits_test = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tes', header=None)

X_digits = digits_train[np.arange(64)]
y_digits = digits_train[64]

estimator = PCA(n_components=2)
X_pca = estimator.fit_transform(X_digits)
print(type(X_pca))

def plot_pca_scatter():
    colors = ['black', 'blue', 'purple', 'yellow', 'white', 'red', 'lime', 'cyan', 'orange', 'gray']
    for i in range(len(colors)):
        px = X_pca[:, 0][y_digits.as_matrix() == i]
        py = X_pca[:, 1][y_digits.as_matrix() == i]
        plt.scatter(px, py, c=colors[i])

    plt.legend(np.arange(0, 10).astype(str))
    plt.xlabel('First Principal Component')
    plt.ylabel('Second Principal Component')
    plt.show()
plot_pca_scatter()

result

由下图可以看出原本64维特征向量压缩至2个维度后，同一类型的digits基本上分布在同一块区域。
这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_38195197/article/details/81482990

机器学习15-特征降维PCA

机器学习算法（九）特征降维——PCA 与 LDA

【机器学习】特征降维 - 主成分分析PCA

机器学习—PCA降维

【机器学习】特征降维

机器学习-特征降维

机器学习(十三)PCA降维原理

机器学习（降维）PCA原理及实现

机器学习算法-PCA降维技术

机器学习-降维算法(PCA算法)

机器学习之PCA降维

[机器学习]--数据降维（PCA）

【机器学习】降维技术-PCA

机器学习：数据降维：PCA 、LDA

机器学习——降维算法PCA

机器学习实战——PCA降维

【机器学习】特征降维-特征选择

[机器学习]特征工程：特征降维

PCA降维：特征降维

机器学习之路：python 特征降维主成分分析 PCA

面向机器学习的特征工程六、降维：用 PCA 压缩数据集

【机器学习】PCA（特征值降维和奇异值降维）—— python3 实现方案

07 特征工程 - 特征降维 - PCA

Python机器学习及实践——特征降维

机器学习（七）特征降维

python机器学习之我见：PCA数据降维

机器学习：PCA（基础理解、降维的理解）

机器学习中的降维方法（PCA和LDA）

机器学习算法总结(九)——降维(SVD, PCA)

机器学习实战：PCA降维样本协方差

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)