【机器学习】PCA案例的python实现

一、说明

        虽然可以通过更改优化算法来加快机器学习算法的拟合速度,但加快算法速度的更常用方法是使用主成分分析 (PCA)。如果您的学习算法由于输入维度太高而太慢,那么使用 PCA 加速它可能是一个合理的选择。这可能是PCA最常见的应用。PCA 的另一个常见应用是数据可视化。

二、PCA简述

2.1 什么是PCA?

        主成分分析(PCA)是一种降低数据维数的方法,用于改进数据可视化和加快机器学习模型训练。

        为了了解使用 PCA 进行数据可视化的价值,本教程文章的第一部分介绍了应用 PCA 后 Iris 数据集的基本可视化。第二部分探讨如何使用 PCA 在修改后的国家标准与技术研究院 (MNIST) 数据集上加速机器学习算法(逻辑回归)。有了这个,让我们开始吧。

2.2 用于数据可视化的 PCA

        对于许多机器学习应用程序,它有助于可视化数据。可视化二维或三维数据并不具有挑战性。但是,即使是本教程这一部分中使用的 Iris 数据集也是四维的。您可以使用 PCA 将该四维数据简化为二维或三维,以便您可以绘制并希望更好地理解数据。

        有关数据科学的更多信息 如何使用 Z 表并创建自己的 Z 表

        第 1 步: 加载鸢尾花数据集
        鸢尾花数据集附带scikit-learn,不需要您从某些外部网站下载任何文件。下面的代码将加载鸢尾花数据集。

import pandas as pd 
url = "https://archive.ics.uci.edu/ml/machine-learning-data

猜你喜欢

转载自blog.csdn.net/gongdiwudu/article/details/131440553
今日推荐