[机器学习与深度学习] - No.4 Normalization和Standardization的区别 - 代码天地

[机器学习与深度学习] - No.4 Normalization和Standardization的区别

其他 2020-04-03 18:55:02 阅读次数: 0

Normalization和Standardization的区别

写在前面：Normalization和Standardization在很多时候，很多文章中并不区分，甚至会使用scaling来代替上述两个词。在这里我们针对两种方法，做一些细微的区分。

Normalization：

将我们的数据值的范围限定在[0,1]之间，也就是我们将常说的归一化。在机器学习的算法中，我们经常会遇到这种情况：

x1	x2
1985	1
1874	3
1600	5

某一列数据的值域和另外一列数据值域相差过大，如果我们只用此类的原始数据，在一些机器学习的优化算法，例如梯度下降中，梯度下降的方向如下所示：

在这里插入图片描述

没有归一化的数据其代价函数看起来像是扁平的碗，同时其梯度下降的方向像是再走“之字形”，迭代很慢。

使用归一化之后的数据，代价函数会看起来很对称，同时训练速度更快，模型精度更高。

常用的归一化方法如下：

最大最小值归一化(线性)：

$x' = \frac{x - x_{min}}{x_{max}-x_{min}}$
对数归一化（非线性）：
$x' = \frac{log_{10}{(x)}}{log_{10}{(x_{max})}}$

Standardization:

将数据进行正态化，使处理后的数据符合标准正态分布，即均值为0，标准差为1。也就是我们常说的标准化。
$x' = \frac{x-\mu}{\delta}$
其中 ${\mu}$ 是指数据的均值， $\delta$ 是指数据的标准差。上述公式又被称为Zero-Mean Normalization 。

总结：

标准化用于调整数据为标准正态分布，归一化用于将数据值域调整为[0,1]。
归一化受最大值，最小值影响；标准化受均值，标准差影响。

发布了118 篇原创文章 · 获赞 140 · 访问量 25万+

私信关注

猜你喜欢

转载自blog.csdn.net/tjuyanming/article/details/90041546

[机器学习与深度学习] - No.4 Normalization和Standardization的区别

机器学习No.4

Java学习NO.4

Linux学习笔记NO.4

HTML学习笔记（JavaScript）NO.4

Java数组和方法No.4

学习网络编程No.4【socket编程实战】

【动手学深度学习pytorch版笔记NO.4】3.3 线性回归的简洁实现

learn C++ NO.4 ——类和对象（2）

Normalization，Regularization 和 standardization

深度学习与机器学习的区别

机器学习与深度学习的区别

深度学习与机器学习区别

DataScience：深入探讨与分析机器学习中的数据处理之线性变换—标准化standardization、归一化Normalization/比例化Scaling的区别与联系

机器学习和深度学习

机器学习和深度学习的区别

深度学习和机器学习的区别

【机器学习系列文章】第4部分：神经网络和深度学习

CS294-112 深度强化学习秋季学期（伯克利）NO.4 Policy gradients introduction

机器学习和深度学习的学习资料

深度学习基础--传统机器学习与深度学习的区别

自己收藏-----机器学习与深度学习的区别

认识机器学习与深度学习的区别

机器学习，深度学习等概念区别【转】

数据挖掘、机器学习、深度学习的区别

【机器学习】机器学习和深度学习概念入门（上）

【机器学习】机器学习和深度学习概念入门（下）

机器学习和深度学习的地址

机器学习和深度学习资源搜集

深度学习和机器学习资料

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)