机器学习中的特征缩放（feature scaling）

其他 2018-06-18 15:09:46 阅读次数: 2

参考：https://blog.csdn.net/iterate7/article/details/78881562

在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放（feature scaling），比如：在随机梯度下降（stochastic gradient descent）算法中，特征缩放有时能提高算法的收敛速度。

什么是特征缩放

特征缩放的目标就是数据规范化，使得特征的范围具有可比性。它是数据处理的预处理处理，对后面的使用数据具有关键作用。

机器算法为什么要特征缩放

特征缩放还可以使机器学习算法工作的更好。比如在K近邻算法中，分类器主要是计算两点之间的欧几里得距离，如果一个特征比其它的特征有更大的范围值，那么距离将会被这个特征值所主导。因此每个特征应该被归一化，比如将取值范围处理为0到1之间。
第二个原因则是，特征缩放也可以加快梯度收敛的速度。

特征缩放的一些方法

调节比例（Rescaling）

这种方法是将数据的特征缩放到[0,1]或[-1,1]之间。缩放到什么范围取决于数据的性质。对于这种方法的公式如下：

$x$

平均值规范化(Mean normalisation)

标准化(Standardization)

特征标准化使每个特征的值有零均值(zero-mean)和单位方差(unit-variance)。这个方法在机器学习地算法中被广泛地使用。例如：SVM，逻辑回归和神经网络。这个方法的公式如下：

缩放到单位长度(Scaling to unit length)

就是除以向量的欧拉长度( the Euclidean length of the vector)，二维范数。

总结

数据的归一化和缩放非常重要，会影响到特征选择和对真实业务问题的判定。

参考

https://en.wikipedia.org/wiki/Feature_scaling

猜你喜欢

转载自www.cnblogs.com/xianhan/p/9195138.html

机器学习中的特征缩放（feature scaling）

特征缩放（feature scaling）

特征缩放 feature scaling

Stanford——机器学习中的特征缩放理解（Features Scaling）

feature scaling

Spark -- 数据的特征缩放(Feature scaling)

可视化特征缩放（Feature Scaling）

浅谈Feature Scaling

131.006 Unsupervised Learning - Feature Scaling | 非监督学习 - 特征缩放

李宏毅深度学习笔记（三）特征缩放(Feature Scaling)

数据特征归一化(Feature Scaling)学习及实现

理解normalization||Standardization||Feature scaling

多维缩放（Multiple Dimensional Scaling）MDS-机器学习

【读书笔记】Feature Scaling （特征缩放）：归一化、标准化、中心化

AWS Auto Scaling (Amazon Auto Scaling)学习笔记

（一）线性回归与特征归一化(feature scaling)

多维缩放(Multiple Dimensional Scaling, MDS)

CockroachDB学习笔记——[译]Scaling Raft

第四十九篇入门机器学习——数据归一化（Feature Scaling）

通俗理解Platt scaling/Platt缩放/普拉特缩放

机器学习系列之precision、recall/scaling、normalization

KNN-距离-数据归一化 Feature Scaling

Linear Regression with multiple variables - Gradient descent in practice I: Feature Scaling

06-数据归一化（Feature Scaling）

多维缩放（MultiDimensional Scaling）——主坐标法（principal coordinate）

ISOMAP算法和MDS(mutiple dimensional scaling)多维缩放

AWS Auto Scaling Group中的Instance如何重启

论文学习：Seeing is Not Believing：Camouflage Attacks on Image Scaling Algorithms

Scaling Architecture

Image scaling

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)