1. 标准化(scale)
标准化目的是去均值。变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。
import numpy as np
from sklearn import preprocessing
in_data = np.array([[5.1, -2.9, 3.3],[-1.2, 7.8, -6.1]])
data_scale = preprocessing.scale(in_data)
2.最小-最大规范化(Min_Max_Scaler)
最小-最大规范化对原始数据进行线性变换,变换到[0,1]区间
3.规范化(Normalization)
规范化是将不同变化范围的值映射到相同的固定范围,常见的是[0,1],此时也称为归一化。
将每个样本变换成unit norm。常见的L1 norm和L2 norm
L2 norm变换后每个样本的各维特征的平方和为1
L1 norm变换后每个样本的各维特征的绝对值和为1
preprocessing.normalize(in_data, norm='l2')
preprocessing.normalize(in_data, norm='l1')
参考: