1.加工特性:特定のアルゴリズムによってデータに変換する統計的(数学的手法)を必要とします。
2.異なるデータタイプは、異なるアプローチがあります。
数値データ:標準的な規模:1、正規化された2、3標準化、欠損値
部門データ:ワンホットエンコーディング
時間タイプ:時点を切断
3.sklearn特徴処理API:sklearn前処理。
4. 正規化:元のデータとの間でデータを変換して(デフォルト[0,1])にマッピングされます。
(式2つの段階、第二Xを算出する第1の演算のx、 )
注:式は、各列の作用、maxは最大値であり、minは次にX「」最終結果は、MXは、MIは、デフォルトは、MX 1の値が指定されている間隔であるように、MIは0であり、最小値です。
正規化プロセス式: