十二 python-pca

其他 2018-07-05 14:54:46 阅读次数: 0

pca的学习

1 pca的推导

pca用来对数据进行简化，它的思想是数据中能够提供较大信息量的特征才是需要注意的特征，而提供很少信息量的特征是各种波动的误差带来的，应该剔除

而在数据个方向上的信息量可以用方差量表示，方差越大证明数据在这个方向上差别越大，能够带来跟多的信息

原始数据 D ，单位方向向量 v
为了方便计算，对D进行去中心化：
这里写图片描述
方差计算公式为：

而协方差：

因此：

优化问题转化为：

利用拉格朗日方程求得v得最优解：

因为v时单位方向向量，因此λ可以看作是协方差矩阵v方向上的特征值
将等式带回目标函数

由此可知，数据某特征的信息量为该特征方向上特征值，特征值越大，信息量越大

2 代码

def pca(datamat,topN):
    meandata=mean(datamat,axis=0) #求数据的均值
    meanremove=datamat-meandata  #数据去中心化
    covmat=cov(meanremove,rowvar=False) #计算协方差
    k,arr=linalg.eig(mat(covmat)) #计算特征值和特征向量
    List=argsort(-k) #特征值从大到小排列，返回索引
    k=k[List] 
    arr=arr[:,List] #特诊向量重排
    k=k[:topN] #最大的topN个特征值
    arr=arr[:,:topN] #最大的topN个特征值对应的特征向量
    newdata=meanremove*arr #将数据转换到新空间

    redata=newdata*arr.T+meandata #重构数据
    return k,arr,redata,newdata

猜你喜欢

转载自blog.csdn.net/qq_35282560/article/details/79480088

十二 python-pca

python-PCA算法详解

Python-PCA降噪效果实例

python网络编程（十二）

python技巧分享（十二）

python学习-十二-集合

Python 学习笔记（十二）

python 基础(十二)

python学习（十二）——查询

Python学习之旅（十二）

Python实战（十二）

python回顾(十二)——文件

python爬虫(十二)-------------------cookie

十二、导出python脚本

python第十二课

python学习笔记---十二

Python基础（十二）

python基础学习（十二）

十二 —— python的内置函数

（十二）Python函数练习

python(十二)——网络编程

Python学习日志（十二）

Python学习笔记（十二）

学习python（十二）——继承

Python（第十二周）

Python学习记录（十二）

python（十二）网络爬虫

python：并发编程（十二）

十二

Python（十二）类和对象

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)