机器学习（一）特征归一化

其他 2020-02-08 10:33:15 阅读次数: 0

特征归一化

场景描述
知识点
总结

场景描述

为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理，使得不同指标之间具有可比性。
例如，分析一个人的身高和体重对健康的影响，如果使用米（m）和千克（kg）作为单位，那么身高特征会在1.6-1.8m的数值范围内，体重特征会在50-100kg的范围内，分析出来的结果显然会倾向于数值差别比较大的体重特征。想要得到更为精准的结果，就需要进行特征归一化（Normalization）处理，使各指标处于同一数值量级，以便进行分析。

问题：为什么需要对数值类型的特征做归一化？

知识点

对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。最常用的方法主要有以下两种。

线性函数归一化（Min-Max Scaling）

它对原始数据进行线性变换，是结果映射到[0，1]的范围，实现对原始数据的等比缩放。归一化公式如下：其中X为原始数据，Xmax、Xmin分别是数据最大值和最小值。
零均值归一化（Z-Score Normalization）

它会将原始数据映射到均值为0、标准差为1的分布上。具体来说，假设原始特征的均值为μ、标准差为α，那么归一化公式为：

例子：（线性函数归一化）
在这里插入图片描述
如图所示，

归一化后的数值之间的关系与原数据数值之间的关系相同。
归一化后的数值在[0, 1]之间，使随机梯度下降算法的收敛速度加快。

总结

当然数据归一化并不是万能的。
在实际应用中，通过梯度下降法求解的模型通常是需要归一化的，包括线性回归、逻辑回归、支持向量机、神经网络等模型。
但对于决策树模型则并不适用，以C4.5为例，决策树在进行节点分裂时，主要依据数据集D关于特征x的信息增益比，而信息增益比跟特征是否经过归一化是无关的的，因为归一化不会改变样本在特征x上的信息增益。

奥特曼丶毕健旗

发布了14 篇原创文章 · 获赞 6 · 访问量 594

私信关注

猜你喜欢

转载自blog.csdn.net/qq_38883844/article/details/104174798

机器学习（一）特征归一化

[机器学习]特征归一化

机器学习之线性回归及特征归一化

机器学习之特征归一化（normalization）

百面机器学习-特征归一化

机器学习面试必知：特征归一化

机器学习数据特征归一化的目的及方式

特征归一化及其原理--机器学习

机器学习（归一化）

机器学习归一化

机器学习-归一化

机器学习 - 归一化

特征归一化

机器学习实战项目1--特征归一化和生成交叉特征

[机器学习] 数据特征标准化和归一化

[机器学习] 数据特征标准化和归一化你了解多少？

轻松读懂机器学习中数据特征标准化和归一化

机器学习中数据特征的处理归一化vs标准化，哪个更好

详解特征归一化详解特征归一化

详解机器学习中的数据处理（二）——特征归一化

【Python】特征归一化

机器学习中归一化方法

机器学习：数据归一化（Scaler）

【机器学习笔记】数据归一化

机器学习之数据归一化

机器学习中的归一化

机器学习数据归一化的方法

机器学习笔记（三）——归一化、KD树、数值型特征无量纲化、数值型特征分箱等

数据特征归一化(Feature Scaling)学习及实现

特征归一化/标准化

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)