特征缩放的适用范围

参考:https://medium.com/greyatom/why-how-and-when-to-scale-your-features-4b30ab09db5e

  • 具有欧几里德距离度量的k个近邻对幅度敏感,因此应按比例缩放所有要素以均等地加权。
  • 在执行主成分分析(PCA)时,缩放至关重要。PCA尝试获取具有最大方差的特征,而对于高强度特征,方差很高。这会使PCA偏向高强度特征。
  • 我们可以通过缩放来加速梯度下降。这是因为θ在小范围内会迅速下降,而在大范围内会缓慢下降,因此当变量非常不均匀时,会无效率地振荡到最佳状态。
  • 基于树的模型不是基于距离的模型,并且可以处理变化范围的要素。因此,在对树进行建模时不需要缩放。
  • 诸如线性判别分析(LDA),朴素贝叶斯(Naive Bayes)之类的算法经过设计可处理此问题,并相应地赋予特征权重。在这些算法中执行特征缩放可能效果不大。

需缩放:KNN、PCA、梯度下降

不需缩放:基于树、LDA、朴素贝叶斯

发布了17 篇原创文章 · 获赞 0 · 访问量 1462

猜你喜欢

转载自blog.csdn.net/red_west/article/details/104924655