数据分析,数据挖掘,机器学习特征值的选择

下面列举一些最常用的方法
1、根据阈值过滤掉方差小的变量。
2、通过计算变量与标签的相关系数,留下相关性高的特征。
3、根据决策树或者随机森林,选择重要程度高的特征。
4、利用PCA等算法,对数据进行变换,选择区分度最高的特征组合。

来自这里的总结

https://blog.csdn.net/u013421629/article/details/78810947

数据挖掘之特征选择

https://blog.csdn.net/yywan1314520/article/details/51013289

具体怎么操作

看这个例子

# 丢弃两个数据集中有任何空值的行

莫凡的python教程

https://www.youtube.com/watch?v=8HlR4TmfV-w

猜你喜欢

转载自blog.csdn.net/qq_35892623/article/details/82943944
今日推荐