下面列举一些最常用的方法
1、根据阈值过滤掉方差小的变量。
2、通过计算变量与标签的相关系数,留下相关性高的特征。
3、根据决策树或者随机森林,选择重要程度高的特征。
4、利用PCA等算法,对数据进行变换,选择区分度最高的特征组合。
来自这里的总结
https://blog.csdn.net/u013421629/article/details/78810947
数据挖掘之特征选择
https://blog.csdn.net/yywan1314520/article/details/51013289
具体怎么操作
看这个例子
# 丢弃两个数据集中有任何空值的行
莫凡的python教程