PCA算法理解 - 代码天地

PCA算法理解

其他 2019-03-16 16:20:51 阅读次数: 0

其实PCA算法与SVD算法目标是一致的，就是简化数据，去噪，PCA有个缺点，可能会缺少重要信息。

PCA有一个核心思想: 方差最大的方向表示数据中最重要的信息。所以PCA算法是在原数据上从新建立一个坐标，新坐标是按照方差最大的方向上建立。

程序上是

1. 需要数据归一化

2. 计算协方差

3. 计算协方差的特征值和特征向量（新的坐标轴）

4. 根据特征值从大到小，保留部分特征

5. 使用保留的特征对应的特征向量对元数据进行降维

协方差是衡量两个变量的变化趋势

扫描二维码关注公众号，回复： 5551879 查看本文章

这里我详细说一下cov的计算过程:

     data  =   [[2,7,9],[3,3,2],[5,7,5]]

2	7	9
3	3	2
5	7	5

cdata = np.cov(data, rowvar=0) rowvar=0在计算协方差时使用data的列作为变量

计算协方差的特征向量与特征值:

w, u= np.linalg.eig(np.mat(cdata))

官方文当的解释 w是特征值的数组,w[i] 对应的特征向量是 u[ :, i]

选择保留的特征，需要给w排序，从大到小，并且找出对应的特征向量（按照特征值从大到小）

rect = u[:, [....]]  #这里就写选择固有特征

给数据降维:

newdata =  data * rect

还原原始数据:

newdata * rect.T

猜你喜欢

转载自blog.csdn.net/weixin_39594447/article/details/88595294

PCA算法理解

PCA算法理解及代码实现

数据清洗和特征选择→PCA→1.算法理解

Paxos算法理解

Manacher算法理解

kmp算法理解

knn算法理解

KNN 算法理解

LSTM算法理解

EM算法理解

Manacher算法理解。

FTRL 算法理解

算法理解

RANSAC算法理解

ICP算法理解

gcForest算法理解

SMO算法理解

回溯算法理解

PageRank算法理解

RSA算法理解

FFT算法理解

SVD算法理解

Viterbri算法理解

RMQ算法理解

哈希算法理解

yolo算法理解

Bresenham算法理解

GBDT算法理解

KMP算法理解与实现

KMP算法理解（二）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)