sklearn的pca降维

data = pd.read_excel(r'C:\Users\Administrator\Desktop\principal_component.xls',header = None)

from sklearn.decomposition import PCA
pca = PCA()#默认不输入n_components时,n_components=min(样本数,特征数)
pca.fit(data)
pca.components_

pca.explained_variance_ratio_#计算下累加的方差,选择n_components的数值

pca = PCA(n_components=3)#3个主成分,n_components='mle'时,利用mle算法自动估计主成分的个数
pca.fit(data)

pca.transform(data)

pd.DataFrame(pca.transform(data))#形成dataframe格式后续计算或保存。

猜你喜欢

转载自blog.csdn.net/weixin_40300458/article/details/81287704