如何找到有意义的特征组合?

生产环境中,会面对多种高维特征,简单的进行两两组合,依然会造成参数过多的问题,所以非常有必要找到有意义的一些组合。

  • 通过对业务理解寻找有意义的特征。比如,物品有点击,展示,图片,描述等特征,我们是否可以将点击/展示作为新的特征呢?这个可以表示物品的点击率。

  • 利用GBDT的叶子节点的输出作为组合特征。

  • 对所有可能得组合,一次去除一个特征组合,计算指标,剔除影响小的。

  • 通过随机森林等,对组合特征尽性重要程度打分,去除打分低的

欢迎关注微信公众号(算法工程师面试那些事儿),本公众号聚焦于算法工程师面试,期待和大家一起刷leecode,刷机器学习、深度学习面试题等,共勉~

算法工程师面试那些事儿

おすすめ

転載: blog.csdn.net/qq_40006058/article/details/121366116