Python scikit-learn,数据的预处理,标准化,StandardScaler

标准化的目的与归一化一样,都是为了避免某个特征的重要程度过大或过小。

标准化的优点:受异常点的影响较小。 适用于繁杂大数据。

demo.py(scikit-learn,数据的预处理,标准化,StandardScaler):

from sklearn.preprocessing import StandardScaler


# 标准化处理
std = StandardScaler()
# (fit_transform()等同于fit()填充数据 + tansform()转换数据)(tansform转换器转换数据时所依赖的均值、标准差等取决于fit()填充的数据)
data = std.fit_transform([[ 1., -1., 3.],[ 2., 4., 2.],[ 4., 6., -1.]])
print(std.mean_)  # [2.33333333 3. 1.33333333]  每列的平均值

print(data)
'''
[[-1.06904497 -1.35873244  0.98058068]
 [-0.26726124  0.33968311  0.39223227]
 [ 1.33630621  1.01904933 -1.37281295]]

'''

猜你喜欢

转载自blog.csdn.net/houyanhua1/article/details/87907632
今日推荐