08_機能の前処理標準化

標準化1.特徴:範囲0の平均および分散1にデータを変換することにより元のデータを変換します。

   データの標準化は、最初に考えたのスケール!

 

2.公式:

 注:式は、各列に作用し、平均値を平均、σは標準偏差であります

   

 

    :安定性データの分散検討

 

3.コンビネーション標準化を理解するために正規化

 

 

4.使用法:

 sklearn特征化API:scikit-learn.preprocessing.StandardScaler

 

 StandardScaler(...)は、すべてのデータの各列の処理後の平均分散の近傍に集まっ0 1

 StandardScaler.fit_transform(X、Y)X:numpyの配列データ形式[n_samples、n_features]戻り値:変換後のアレイの形状と同じ

 各列のStandardScaler.mean_生データ(今、この方法.with_meanに変更し、私は、この結果が真である印刷)の平均特性

 (今方法.with_stdに変更)各列の特徴の元のデータのStandardScaler.std_分散

 

正規化ステップ:1、インスタンスStandardScaler   

       2、fit_transform変換することにより

 

ケース6:[[1、-1、3]、[2]、[4,2]、[4,6、-1]]標準化

  

sklearn.preprocessing輸入StandardScalerから

デフ)(スタンド:
    「」」
    標準化されたスケール
    「」」
    STD = StandardScaler()
    データ= std.fit_transform([1、-1、3]、[2、4、2]、[4、6、-1]])
    印刷(std.with_mean)
    印刷(std.with_std)
    印刷(データ)


__name__ == '__main__' の場合:
    スタンド()

「」」 結果: [-1.06904497 -1.35873244 0.98058068] 【-0.26726124 0.33968311 0.39223227] 【1.33630621 1.01904933 -1.37281295] 「」」

  

  

 

おすすめ

転載: www.cnblogs.com/cwj2019/p/11720415.html
おすすめ