数据归一化/标准化

方法1:归一化(normalization):将值转化为0—1之间

                                                                  x^{'}=(x-x_{min})/(x_{max}-x_{min})

调用方法:from sklearn import MinMaxScaler(feature_range=num)

说明:超参数feature_range默认为1,可以自己设置新值得范围0—num

方法2:标准化(standardization) :新值得分布具有单位方差

                                                                      x^{'}=(x-mean(x))/var(x)

调用方法:from sklearn import StandardScaler 

特别说明:与机器学习中的所以转化一样,缩放器只能用于单独用于训练集和新的数据(测试集),而不能应用于完整的数据集(包括测试集)

猜你喜欢

转载自blog.csdn.net/yzy__zju/article/details/84235111