机器学习100天---day05 主成分分析Python Numpy实现 - 代码天地

机器学习100天---day05 主成分分析Python Numpy实现

企业开发 2018-09-30 09:47:11 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/yangyang_yangqi/article/details/82901096

#_*_coding:utf-8_*_

'''
PCA：降维
'''
'''
将数据转换为只保留前N个主成分特征空间
1、去除平均值
2、计算协方差矩阵
3、计算协方差矩阵的特征值和特征向量
4、将特征值排序保留前N个最大特征值对应的特征向量
5、将数据转换到上面得到的N个特征向量构建的特征空间(实现了特征压缩)
'''
import numpy as np
import pandas as pd
from sklearn.datasets import load_digits


datasets = load_digits().data

def percent2n(eigVals,percent):
    sortArray=np.sort(eigVals)   #升序
    sortArray=sortArray[-1::-1]  #逆转，即降序
    arraySum=sum(sortArray)
    tmp=0
    num=0
    for i in sortArray:
        tmp+=i
        num+=1
        if tmp>=arraySum*percent:
            return num

def pca(datasets,percent=0.99):
    #求每一列的均值   若rowvar非0，一列代表一个样本，为0，一行代表一个样本
    meanVals = np.mean(datasets,axis=0)
    #数据矩阵的每一列减去该列的均值
    meanRemoved = datasets - meanVals
    #计算协方差矩阵，除以n-1是为了得到协方差的无偏估计
    covMat = np.cov(meanRemoved,rowvar=0)
    #计算协方差矩阵的特征值和特征向量       一列一个特征向量
    eigVals,eigVects= np.linalg.eig(np.mat(covMat))#np.mat() 构建矩阵

    n = percent2n(eigVals, percent)
    print(n)
    #argsort():对特征值矩阵进行由大到小的排序，返回对应排序后的索引
    eigValId= np.argsort(eigVals)
    #从排序后的矩阵最后一个开始自下而上选取最大的N个特征值，返回其对应的索引值
    eigValId = eigValId[:-(n+1):-1]  #这里三个数值分别表示：起始位置：重点位置：步长 最后-1表示倒序
    #将特征值最大的N个特征值对应索引的特征向量提取出来，组成压缩矩阵     eigValId 抽取数组中对应值的特定列
    redeigVects= eigVects[:,eigValId]
    #将去均值后的数据矩阵*压缩矩阵，转换到新的矩阵空间，使维度降维N
    lowDatasets = meanRemoved * redeigVects
    #利用降维后的矩阵反构出原数矩阵
    reconMat = (lowDatasets * redeigVects.T) + meanVals
    return lowDatasets,reconMat

low,rec = pca(datasets)
print(low.shape)

我的GitHub地址，欢迎大家指教

猜你喜欢

转载自blog.csdn.net/yangyang_yangqi/article/details/82901096

机器学习100天---day05 主成分分析Python Numpy实现

【机器学习算法实现】主成分分析(PCA)——基于python+numpy

【机器学习算法实现】主成分分析 PCA ——基于python+numpy

[python机器学习及实践(6)]Sklearn实现主成分分析（PCA）

【机器学习】主成分分析(PCA)算法及Matlab实现

【机器学习】主成分分析实现案例（PCA）

深入学习主成分分析（PCA）算法原理及其Python实现

PCA主成分分析Python实现

主成分分析python代码实现

python-主成分分析实现

python实现主成分分析（PCA）

吴恩达机器学习作业Python实现(七)：K-means和PCA主成分分析

机器学习算法之PCA（主成分分析）人脸识别，最小重构误差和最大化散度证明，PCA主成分分析原理剖析，PCA人脸识别matlab实现，PCA人脸识别python实现

Python机器学习 -- 主成分分析（PCA）

Python机器学习 PCA降维（主成分分析）

机器学习-主成分分析PCA-Python代码

Python机器学习13——主成分分析

PCA主成分分析---降维（python调用实现）

python实现PCA（主成分分析）算法

算法专题01 - 主成分分析及Python实现

主成分分析法(PCA)及其python实现

主成分分析原理以及SPSS和Python实现

PCA（主成分分析法）的Python代码实现（numpy，sklearn）

机器学习中的主成分分析(PCA)原理+代码实现

吴恩达机器学习课程笔记+代码实现(23)Python实现主成分分析法PCA(Programming Exercise 7.2)

机器学习系列-主成分分析

机器学习_主成分分析

【机器学习】主成分分析PCA

机器学习 - 主成分分析

机器学习——主成分分析PCA

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)