1.什么是归一化,它与标准化的区别是什么

不同点

对比点 归一化 标准化
概念 将数值规约到(0,1)或(-1,1)区间 将对应数据的分布规约在均值为0,标准差为1的分布上
侧重点 数值的归一,丢失数据的分布信息,对数据之间的距离没有得到较好的保留,但保留了权重 数据分布的归一,较好的保留了数据之间的分布,也即保留了样本之间的距离,但丢失了权值
形式 在这里插入图片描述 在这里插入图片描述
缺点 1.丢失样本间的距离信息;2.鲁棒性较差,当有新的样本加入时最大值与最小值很容易受异常点影响 1.丢失样本间的权重信息;
适合场景 1.小数据/固定数据的使用;2.不涉及距离度量、协方差计算、数据不符合正态分布的时候;3.进行多指标综合评价的时候; 1.在分类、聚类算法中,需要使用距离来度量相似性;2.有较好的鲁棒性,有产出取值范围的离散数据或对最大值最小值未知的情况下;
缩放方式 先使用最小值平移,后使用最值差缩放 先使用均值u平移,之后用标准差进行缩放
目的 便于消除量纲,将各个指标的数据纳入到综合评价中; 便于后续的梯度下降和激活函数对数据的处理。因为标准化后,数据以0为中心左右分布,而函数sigmoid,Tanh,Softmax等也都以0为中心左右分布;

相同点及其联系

  1. 联系:归一化广义上是包含标准化的,以上主要是从狭义上区分两者。
  2. 本质上都是进行特征提取,方便最终数据的比较。
  3. 都是为了缩小范围,便于后续的数据处理。
  4. 作用:加快梯度下降,损失函数收敛; 提升模型精度; 防止梯度爆炸(消除因为输入差距过大而带来的输出差距过大,进而在反向传播的过程当中导致梯度过大,从而形成梯度爆炸)
发布了371 篇原创文章 · 获赞 36 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/strawqqhat/article/details/105143942