sklearn
機械学習用のPythonオープンソースフレームワーク。
sklearn公式サイトの
sklearn中国のネットワーク
sklearn.preprocessing.StandardScaler
特徴は、平均を削除して単位分散にスケーリングすることにより正規化されます。
式は次のとおりです。
$ z = \ frac {x- \ mu} {\ sigma} $
$ \ mu $はトレーニングサンプルの平均値、$ \ sigma $はトレーニングサンプルの標準偏差です。
sklearn.preprocessingからインポートStandardScaler
StandardScaler(copy = True、with_mean = True、with_std = True)
- パラメータ:
copy:ブール値。デフォルトはTrueです。Falseの場合、その
場所でスケーリングされ、新しいオブジェクトは生成されません。
with_mean:ブール値。デフォルトはTrueです。Trueの
場合、スケーリングの前にデータを中央に配置してください。
with_std:ブール値。デフォルトはTrueです。Trueの
場合、データは単位分散にスケーリングされます。
- 属性:
scale_ :ndarrayまたはNone
各フィーチャデータの相対スケール。
mean_:ndarrayまたはNone
トレーニングセット内の各特徴の平均値。
var_:None
のndarray トレーニングセット内の各特徴の分散。
n_samples_seen_:intまたは配列
は、各フィーチャに対して処理されたサンプルの数です。欠損値がない場合は整数、それ以外の場合は配列です。
- 方法:
フィット(自己、X、y =なし)
は、平均を計算し、後でスケーリングするためにstdを計算します。
fit_transform(self、X、y = None、** fit_params)
は、平均とstdを計算し、それを変換します。
パラメータ:
X:numpy配列、トレーニングセット。
y:numpy配列、ターゲット値。
** fit_params:dict、その他のフィッティングパラメータ。
戻り値:
numpy配列、変換された配列。
get_params(self、deep = True) *
この推定のパラメーターを取得します。
reverse_transform(self、X、copy = None)
は、元の形式に比例してデータをスケーリングします。partial_fit(self、X、
y = None)
は、平均値を計算し、将来のスケーリングのためにXのstdをオンラインで計算します。
set_params(self、** params)
は、この推定器のパラメーターを設定します。
transform(self、X、copy = None)
は、センタリングとスケーリングによって標準化を実行します。