机器学习特征工程之数据降维

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/broccoli2/article/details/80974048

为什么进行特征选择?

  • 冗余:部分特征的相关度较高,容易消耗计算性能。
  • 噪声:部分特征对预测结果有影响。

特征选择是什么

这里写图片描述

特征选择API

sklearn.feature_selection.VarianceThold

主成分分析PCA

PCA是什么?
本质:PCA是一种分析、简化数据集的技术。
目的:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。
作用可以消减回归分析或者聚类分析中特征的数量。

PCA降维分析可以参考以下文章:
PCA降维实例分析
数据降维

猜你喜欢

转载自blog.csdn.net/broccoli2/article/details/80974048