数据降维(Dimensionality reduction)

其他 2018-12-01 14:08:17 阅读次数: 0

数据降维(Dimensionality reduction)

应用范围

无监督学习
图片压缩(需要的时候在还原回来)
数据压缩
数据可视化

数据压缩(Data Compression)

将高维的数据转变为低维的数据, 这样我们存储数据的矩阵的列就减少了, 那么我们需要存储的数据就减少了

数据可视化

数据可视化是非常重要的, 通过可视化数据可以发现数据的规律, 但是大多数时候我们到的数据是高维度的, 可视化很困难, 采用数据降维可以将数据降到二维进行数据可视化

加快机器学习算法的速度

维度少了程序运行就快了

算法

PCA

注意点

数据降维不是随意降维的, 我们要首先发现样本的规律, 如果样本在2D时都在一条之间上, 那么我们可以将数据都投影到这条直线上, 从而降到1D; 如果在3D中, 基本上在一个平面上, 我们可以将所有的数据都投影到这个平面上, 从而降到2D; 降维要找的直线或者平面我们要保证原始原始样本到新的直线或者平面的距离和最小, 从而保留尽可能多的信息
使用PCA降维时需要对数据进行标准化

PCA降维步骤

数据标准化
计算协方差矩阵: \(\Sigma{1\over{m}}X^TX\), 其中X为样本, 在MATLAB中Sigma = 1 / m * X' * X
调用svd函数计算出协方差矩阵的特征向量: [U, S, V] = svd(Sigma), 其中U为特征矩阵, 其他返回的变量暂时用不到
U是一个\(nxn\)的矩阵, \(n\)表示原始数据特征的数量, 选择K个作为我们新的特征
获取新的数据: Z = X * U(:, 1:K), Z就是一个\(mxk\)的新的样本

恢复数据

X_recovered = Z * U(:, 1:K)', 通过这条语句得到的X_recovered = X * U(:, 1:K) * U(:, 1:K)', 我们恢复的数据并不是要原先的数据, 但是已经非常接近了, 只是原来的数据X乘以U与U的转置的乘积

猜你喜欢

转载自www.cnblogs.com/megachen/p/10049129.html

数据降维(Dimensionality reduction)

Dimensionality Reduction(降维)

机器学习笔记——降维（dimensionality reduction）

Dimensionality Reduction

第八章——降维（Dimensionality Reduction）

Andrew Ng 机器学习笔记 13 ：降维(dimensionality reduction)

聚类之降维(Dimensionality Reduction)算法详解

数据降维（Dimension Reduction）

维数约减--Dimensionality Reduction

【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 14—Dimensionality Reduction 降维

机器学习课程-第8周-降维(Dimensionality Reduction)—主成分分析(PCA)

吴恩达机器学习课程笔记+代码实现(21)14.降维(Dimensionality Reduction)

单细胞数据高级分析之初步降维和聚类 | Dimensionality reduction | Clustering

吴恩达机器学习之降维(Dimensionality Reduction)（二）：动机二——数据可视化（详细笔记，建议收藏，已有专栏）

吴恩达机器学习之降维(Dimensionality Reduction)（一）：动机一——数据压缩（详细笔记，建议收藏，已有专栏）

dimension reduction （降维）方法总结

机器学习Machine Learning：特征选择Feature Selection 与数据降维Dimension Reduction的区别？

论文笔记：Nonlinear Dimensionality Reduction by Locally Linear Embedding

Orthogonal Neighborhood Preserving Projections: A projection-based dimensionality reduction technique

[CS131] Lecture 12 Face Recognition & Dimensionality Reduction

Review of Feature Selection, Dimensionality Reduction and Classification for Chronic Disease Diagnos

吴恩达机器学习之降维(Dimensionality Reduction)（四）：主成分分析问题、主成分分析算法、选择主成分的数量（详细笔记，建议收藏，已有专栏）

吴恩达机器学习之降维(Dimensionality Reduction)（三）：主成分分析问题、主成分分析算法、选择主成分的数量（详细笔记，建议收藏，已有专栏）

Unsupervised Learning: Linear Dimension Reduction---无监督学习：线性降维

13、Unsupervised Learning: Linear Dimension Reduction（无监督学习：线性降维）

计算机视觉论文笔记五：Maximal Linear Embedding for Dimensionality Reduction

子空间学习论文笔记02:Laplacian Eigenmaps for Dimensionality Reduction and Data Representation

scala-MLlib官方文档---spark.mllib package-Dimensionality reduction+Feature Extraction and Transformation

cp5_Compressing Data via Dimensionality Reduction_PCA_LDA_convergence_kernel PCA

数据预处理之数据规约（Data Reduction）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)