Principal Component Analysis(PCA)

其他 2019-03-12 22:11:29 阅读次数: 0

Principal Component Analysis(PCA)

概念

去中心化(零均值化): 将输入的特征减去特征的均值, 相当于特征进行了平移, \[x_j - \bar x_j\]
归一化(标准化): 将输入的特征减去特征的均值, 得到的差在除以特征的标准差, \[{{x_j-\bar x_j}\over{std(x_j)}}\]在进行PCA之前, 一定要进行零均值化或者标准化

用途

数据压缩(Data Compression)
数据可视化(Data Visualization)
提高算法执行效率

PCA实现步骤

数据零均值化或者标准化
计算样本矩阵的协方差矩阵Covariance, \[\Sigma={1\over{m}}\sum_{i=1}^{m} x^{(i)}x^{(i)T}\]
计算协方差矩阵的特征向量eigenvectors, \[[U, S, V] = svd(sigma)\]U即为特征向量矩阵
选择保留的特征, \[Ureduce = U(:, 1:k)\]
将Ureduce转为样本, \(Z = Ureduce^TX\)

数据还原

将被PCA处理过的数据尽可能的还原成原始数据
\(X_{approx} = (Ureduce^T)^{-1}X\)

PCA实现补充

如何选择k变量, 即保留的特征数量
- 设k从1开始递增迭代到PCA算法中
- 还原数据得到\(X_{approx}\)
- 比较\[{{{1\over{m}}\sum_{i=1}^m(x^{(i)}-x^{(i)}_{approx})^2}\over{{1\over{m}}\sum_{i=1}^mx^{(i)T}x^{(i)}}}\le0.01\]
- 如果小于0.01, 则表示当k取\(\hat k\)时, 我们保留了原始数据的99%

什么时候考虑PCA

在一开始处理数据的时候, 应该尽量使用原始数据, 当是在不行的时候再使用PCA处理

猜你喜欢

转载自www.cnblogs.com/megachen/p/10519923.html

Principal Component Analysis(PCA)

Principal Component Analysis (PCA)

PCA(Principal Component Analysis)笔记

特征降维-PCA（Principal Component Analysis）

Probabilistic Principal Component Analysis

Principal Component Analysis

PCA（Principal Component Analysis,主成分分析）降维

主成分分析（Principal Component Analysis，PCA）详解

PCA（Principal Component Analysis）数学分析

主成分分析PCA（Principal Component Analysis）介绍

PCA(principal Component Analysis) 主成分分析

【ML】主成分分析 PCA (Principal Component Analysis)

Principal component analysis(PCA)主成分分析

主成分分析（PCA，Principal Component Analysis）

主成分分析（PCA）Principal Component Analysis

【机器学习】 PCA（Principal Component Analysis）——主成分分析

主成分分析（Principal Component Analysis，PCA）

SPSS 主成分分析（Principal Component Analysis,PCA）

PCA（Principal Component Analysis）主成分分析

主成分分析法（Principal Component Analysis,PCA）

主成分分析（PCA）（principal component analysis）

Robust Principal Component Analysis?（PCP）

PCA(Principal Components Analysis)

主成分分析法Principal component analysis (PCA)介绍

基于OpenCV3实现人脸识别（原理篇）---PCA（Principal Component Analysis）

机器学习入门 05 主成分分析 PCA（Principal Component Analysis）

第10章 Principal Component Analysis 人脸识别（PCA+SVM）

主成分分析（Principal Component Analysis, PCA）原理全面解析与应用

机器学习之主成分分析（Principal Component Analysis，PCA）案例解析附代码

机器学习笔记 ---- Principal Component Analysis

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)