StandardScaler役割:
StandardScalerデータセットを行うように正規化され、彼は、各特徴ことに基づいて計算単位として実行しました
計算方法:
(元の値 - 平均値)/標準偏差
コードの検証:
コールStandardScaler
import numpy as np
from sklearn.preprocessing import StandardScaler
np.random.seed(42)
samples = np.random.randn(10,1)
scaler = StandardScaler()
scaler.fit(samples)
でる:
StandardScaler(copy=True, with_mean=True, with_std=True)
手動で行います
# 预测函数
def scale(series, x):
mean = np.mean(series)
std = np.std(series)
return (x-mean)/std
検証
scale(samples[:,0], np.array([[1],[2]]))
でる:
array([[0.80468598],
[2.26261185]])
scaler.transform(np.array([[1],[2]]))
でる:
array([[0.80468598],
[2.26261185]])
結論
算出されるStandardScalerアルゴリズムを、検証されているのと同じ結果と手動方法:
失敗したダンプを再アップロードするためにキャンセルされなかったダンプ再アップロードをキャンセル