介绍 Intro
数据的归一化,就是将各路嘈杂的数据映射到一个统一的区间上,只保留相对尺度而消去背景信息,从而方便下一步处理。
常用的归一化区间有
-
[0,1]
-
[−1,1]
-
[−0.5,0.5]
-
[a,b]
自定义区间
解决的问题
- 输入的数据单位不一样,导致难以直接处理。比如给人推荐衣服,身高的参数可能是
(1.5m,1.8m)
, 而体重的参数可能是
(40kg,100kg)
, 这两个数据就需要归一化之后再做下一步处理
- 数据变化区间不同,对模型的影响不同,比如
x1∈(−200,5000)
和
x2∈(10,16)
相比,前者对模型的影响显著大于后者。
- 将
y′
与
y
对应起来。模型的输出
y′
可能是
(0.1,0.5)
, 而 ground truth 中的
y
可能是
(120,280)
,需要把二者对应起来。
常用方法 Methods
线性归一化
将
x∈(min,max)
映射到
(a,b)
区间,其操作为
x′=x−minmax−min×(b−a)+a
非线性归一化
使用归一化函数
Ref