Pythonの機械学習-chapter3_1

前処理データの•いくつかの方法:

StandardScaler:同じ大きさのために、すべての機能、各特徴の平均値が0、分散1であることを確実にします。しかし、我々は、任意の特定の最大値と最小値の特性を保証することはできません。

同じ範囲内の各特徴の統計的特性が、中央値と四分位数を用いることを保証するのに類似しており、StandardScaler:RobustScaler。これは、データに異常値を無視します。

MinMaxScaler:そのようちょうど0-1間の機能のすべてが移動するデータを、。

各データポイントをスケーリングする、ヨーロッパの今後の特徴ベクトルの長さは1に等しい。データは半径1の円上に投影するように、より高い次元のデータ、球面上に投影:ノーマ。方向や角度が重要であり、特徴ベクトルの長さは重要ではありませんデータに適用されます。

 

おすすめ

転載: www.cnblogs.com/bozi/p/12369272.html