sklearn 特征降维利器(PCA 和TSNE)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hxcaifly/article/details/80414009

同为降维工具,二者的主要区别在于:
1.所在的包不同(也即机制和原理不同)
- from sklearn.decomposition import PCA
- from sklearn.manifold import TSNE
2.因为原理不同,导致,tsne 保留下的属性信息,更具代表性,也即最能体现样本间的差异;
3.TSNE 运行极慢,PCA 则相对较快;

因此更为一般的处理,尤其在展示(可视化)高维数据时,常常先用 PCA 进行降维,再使用 tsne:

data_pca = PCA(n_components=50).fit_transform(data)
data_pca_tsne = TSNE(n_components=2).fit_transform(data_pca)

猜你喜欢

转载自blog.csdn.net/hxcaifly/article/details/80414009