为什么对数值类型的特征归一化？ - 代码天地

为什么对数值类型的特征归一化？

其他 2021-11-25 05:32:58 阅读次数: 0

特征归一化主要是为了消除量纲的影响，以房价预测为例，卧室面积城镇人口数量都会对房价有影响，在进行距离有关的计算时，单位的不同会导致计算结果的不同，尺度大的特征会起决定性作用，而尺度小的特征其作用可能会被忽略，所以，为了消除特征间单位和尺度差异的影响，以对每维特征同等看待，需要对特征进行归一化。

对数值特征进行归一化，可以将不同的特征统一到大致相同的范围内，常用归一化方法有：

线性归一化

根据最大值、最小值对原始数据进行先行变换，讲结果映射到[0, 1]

$x^* = \frac{x - x_{min}}{x - x_{max}}$

$x$ 为原始数据， $x_{min}, x_{max}$ 为特征的最小值和最大值

零均值归一化（标准化）

将原始数据映射到均值为0，方差为1的正太分布上

$x^* = \frac{x - \mu}{\sigma}$

两个特征对应的参数分别为 $\theta_1$ , $\theta_2$ ，左图为未归一化对应的损失函数等值图，右图为归一化后对应的损失函数等值图。在学习速率相同的情况下，归一化前， $\theta_1$ 的更新速率大于 $\theta_2$ ，需要更多的迭代次数才能达到最优解；归一化后， $\theta_1$ , $\theta_2$ 在相同分数值区间，两者的更新速率更一致，有助于梯度下降找到最优解。

归一化通常在通过梯度下降方法求解的模型中，例如逻辑回归、神经网络、支持向量机等，树模型以基尼指数、信息增益等进行分裂，归一化在树模型中并不适用

欢迎关注微信公众号（算法工程师面试那些事儿)，本公众号聚焦于算法工程师面试，期待和大家一起刷leecode，刷机器学习、深度学习面试题等，共勉～

算法工程师面试那些事儿

猜你喜欢

转载自blog.csdn.net/qq_40006058/article/details/121217923

为什么对数值类型的特征归一化？

1.为什么需要对数值类型的特征做归一化？

1.1为什么需要对数值类型的特征做归一化？

为什么要对数值类型的特征做归一化，树形算法为啥不需要归一化？

对数值类型的特征做归一化的必要性

每天五分钟机器学习:为什么要对样本数值类型的特征进行归一化？

为什么要对数据归一化？

为什么要对数据进行「归一化」？

为什么要做特征归一化/标准化？

为什么要做特征的归一化/标准化？

为什么一些机器学习模型需要对数据进行归一化？

机器学习中为什么需要对数据进行归一化？

【机器学习】为什么机器学习模型需要对数据进行归一化？

数据预处理：数值特征归一化

特征归一化

对数据的归一化

机器学习笔记（三）——归一化、KD树、数值型特征无量纲化、数值型特征分箱等

为什么要数据归一化和归一化方法为什么要数据归一化和归一化方法

详解特征归一化详解特征归一化

【Python】特征归一化

为什么需要批归一化层

第二节数值型特征进行归一化或标准化处理

机器学习笔记：为什么要对数据进行归一化处理？

特征归一化/标准化

准备数据：归一化数值

机器学习（一）特征归一化

数据归一化特征处理

归一化特征值

特征归一化方法之选取

[机器学习]特征归一化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)