归一化与标准化详解

  

  归一化(Normalization)

  1.把数据变为(0,1)之间的小数。主要是为了方便数据处理,因为将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。

  2.把有量纲表达式变换为无量纲表达式,成为纯量。经过归一化处理的数据,处于同一数量级,可以消除指标之间的量纲和量纲单位的影响,提高不同数据指标之间的可比性。

  主要算法:

  1.线性转换,即min-max归一化(常用方法)

  y=(x-min)/(max-min)

  2. 对数函数转换

  y=log10(x)

  3.反余切函数转换

  y=atan(x)*2/PI

扫描二维码关注公众号,回复: 3818640 查看本文章

  标准化(Standardization)

  数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

  主要方法:

  1.z-score标准化,即零-均值标准化(常用方法)

  y=(x-μ)/σ

  是一种统计的处理,基于正态分布的假设,将数据变换为均值为0、标准差为1的标准正态分布。但即使数据不服从正态分布,也可以用此法。特别适用于数据的最大值和最小值未知,或存在孤立点。

  2.小数定标标准化

  y=x/10^j (j确保max(|y|)1)

  通过移动x的小数位置进行标准化

  3.对数Logistic模式

  y=1/(1+e^(-x))

猜你喜欢

转载自blog.csdn.net/qianfeng_dashuju/article/details/83510147