数据归一化的方法

版权声明:原创文章未经博主允许不得转载O(-_-)O!!! https://blog.csdn.net/u013894072/article/details/53738454

数据特征之间往往有着不同的分布区间,差异较大的情况下会很大程度的影响数据分析的结果。为了消除这种现象的影响需要对原始数据进行归一化处理,使得各个指标处于同一数量级。
(1)max-min归一化
也叫离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。公式为:
X=(X-min)/(max-min)
max:最大值,min:最小值。
(2)Z-score标准化
这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。公式为:
X=(X-u)/t
u:均值,t:标准差

猜你喜欢

转载自blog.csdn.net/u013894072/article/details/53738454