Bobo老师机器学习笔记第七课-如何通过PCA实现高维数据向低维数据的转换 - 代码天地

Bobo老师机器学习笔记第七课-如何通过PCA实现高维数据向低维数据的转换

企业开发 2018-11-05 05:11:11 阅读次数: 0

在上一篇博客中我们总结如何求出前N个主成分，这篇博客中我们主要讲述如何通过PCA实现高维数据向低维数据的转变。

高维数据向低维数据的转变的核心是重新建立新的坐标系，而这个坐标系就是前K个主成分构成矩阵。所以问题简化为如何通过高位矩阵和前K主成分矩阵，找出新坐标下的地位矩阵

首先假设数据X和前K个主成分我们已经求得如下：

转换公式其实很简单，如下：

从上图可以看到X乘以W的转置矩阵就会获取一个m*k的地位矩阵了。

此外如果知道低维数据，也可以通过坐标系W还原到原来的X（m）数据。不过此处要注意，还原后的数据虽然和愿数据维度不变，但是数据有一定的损失，下面我们通过编程来直观的看一下。

二、编码实现

基于上一篇博客的代码，增加如下代码：

    def transform(self, X):
        """将给定的X，映射到各个主成分分量中"""
        assert X.shape[1] == self.components_.shape[1]

        return X.dot(self.components_.T)

    def inverse_transform(self, X):
        """将给定的X，反向映射回原来的特征空间"""
        assert X.shape[1] == self.components_.shape[0]

        return X.dot(self.components_)

测试代码：

    x = np.random.randint(1, 100, size=100)
    X = np.empty((100, 2))
    X[:, 0] = x
    X[:, 1] = 0.75 * x + 3. + np.random.normal(1,10., size=len(x))
    pca = PCA(n_components=1)
    pca.fit(X)
    w = pca.components_[0]
    X_reduction = pca.transform(X)
    print('X_reduction:', X_reduction.shape)
    X_restore = pca.inverse_transform(X_reduction)
    print('X_restore:', X_restore.shape)

    plt.scatter(X[:, 0], X[:, 1], color='b', alpha=0.5, label='X')
    plt.scatter(X_restore[:, 0], X_restore[:, 1], color='r', alpha=0.5, label='Restore X')
    plt.plot([0, w[0] * 30], [0, w[1] * 30], color='g', label='W')
    plt.legend()
    plt.show()

测试代码把2维X降维到1维 X_reduction，映射的坐标是w方向，然后又用w方向把X_reduction还原成X_restore。不过可以看出

restore_X和X相比存在数据损失。restore_X是2维数据，但看起来在一条直线上，因此可以为还原后的restore_X仅仅是通过高维空间来表达低维空间的数据。

猜你喜欢

转载自blog.csdn.net/sxb0841901116/article/details/83718066

Bobo老师机器学习笔记第七课-如何通过PCA实现高维数据向低维数据的转换

Bobo老师机器学习笔记第七课-如何求得前N个主成分

Bobo老师机器学习笔记第七课-主成分分析法

机器学习：PCA（高维数据映射为低维数据封装&调用）

Bobo老师机器学习笔记-数据归一化

Linux运维第七课----Linux基础优化

Bobo老师机器学习笔记第九课-如何处理多分类任务？

[机器学习]--数据降维（PCA）

机器学习：数据降维：PCA 、LDA

华为立体运维－第七课(智能运维)

学习笔记第七课暂停法跳过报错弹窗实现破解

Bobo老师机器学习笔记第八课-如何防止过拟合和欠拟合？

机器学习数据预处理：数据降维之PCA

bobo老师机器学习笔记-第三课：机器学习的基本工具

Python第七课笔记

第七课沉浮笔记

第七课听课笔记

读书笔记-第七课

Java学习第七课总结

学习linux第七课！

python机器学习之我见：PCA数据降维

机器学习实战-利用PCA来简化数据(降维)

机器学习-数据预处理02-PCA降维

机器学习降维之PCA（python代码+数据）

Bobo老师机器学习笔记第六课-调试梯度下降法

bobo老师机器学习笔记-第四课：KNN算法

Bobo老师机器学习笔记第五课-多元线性回归

Bobo老师机器学习笔记第五课-线性回归算法的评估指标

Bobo老师机器学习笔记第五课-简单线性回归

Bobo老师机器学习笔记第六课-梯度下降法

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)