归一化前：

这里写图片描述

归一化后：

这里写图片描述

在统计学中，归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在-1–+1之间是统计的坐标分布。

假设有两个变量，都是均匀分布，X1范围是100000到200000，X2的范围是1到2。现在请在一张A4纸上画个坐标，点出这些点。很显然，你会点出很多处于同一直线上的点，我们称这条直线为L。也就是说，如果现在我们要做一个classification的话，X2几乎可以被忽略。X2很无辜的被干掉了，仅仅因为所谓量纲的问题。即便X2不被干掉，我们现在继续求解，来做 gradient descent。很显然，如果某一步我们求得的下降方向不在直线L上，几乎可以肯定肯定这步不会下降。这就会导致不收敛，或者收敛但很慢。再来，我们做一遍归一化，全部化为[0,1]区间上。现在再在纸上画个坐标，点出这些点。好了，他们现在均匀的分布在一个圆的范围内。X2不会被忽略了，收敛的问题也解决了。

在量纲不一而对比标准统一的时候需要做归一化，归一化也有很多方法，正确选择方法对数据处理的有效性和精确性影响很大。

一张表有两个变量，一个是体重kg，一个是身高cm。假设一般情况下体重这个变量均值为60（kg），身高均值为170（cm）。1，这两个变量对应的单位不一样，同样是100，对于身高来说很矮，但对于体重来说已经是超重了。2，单位越小，数值越大，对结果的影响也越大，譬如170cm=1.7m。简单讲，归一化的目的是可以用数值来直接进行比较，如果不归一化由于变量特性不同，同样加10，代表的意义不一样。

张大鹏的博客

发布了203 篇原创文章 · 获赞 68 · 访问量 72万+

他的留言板关注

归一化的意义笔记

归一化前：

归一化后：

猜你喜欢