机器学习面试—特征选择

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ZK_J1994/article/details/81319326

过滤式特征选择(先对特征进行过滤,再训练模型)

  • 基本准则:计算每个特征的统计属性,根据阈值选择,或者选择固定的多少个特征

 

  • 基于方差

 

  • 基于皮尔逊相关系数(度量特征与目标变量的线性关系)

 

  • 基于互信息(可以度量特征与目标变量的非线性关系)

 

  • 基于信息增益,基尼指数等

包装式特征选择(给当前模型搜索一个最好的特征子集)

  • 基本准则:从原特征集中生成多个特征子集,使用模型进行学习,评价,从而选出最优特征子

 

  • 蛮力搜索

 

  • 随机搜索

 

  • 启发式搜索

嵌入式特征选择(将特征选择融入到模型训练之中)

  • 基于正则化的特征选择

 

  • 基于树模型特征选择

 

参考文献

常用的特征工程选择办法

猜你喜欢

转载自blog.csdn.net/ZK_J1994/article/details/81319326