特征缩放（feature scaling） - 代码天地

特征缩放（feature scaling）

其他 2018-09-25 00:18:56 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_31617409/article/details/82726904

机会永远留给有准备的人，不积跬步，无以至千里，厚积而薄发，与大家共勉！加油！

博主最近在学习吴恩达的机器学习课程，将一些日常学习本人认为重要的地方在此记录，与大家分享，如有错误，请大家不吝赐教！ github:https://github.com/ScathonLin

在梯度下降算法运用中，如果能保证不同特征的取值在相同或者相近的范围内，比如都处于0-1之间，那么梯度下降算法将会能很很快的收敛。

例如，一个含有两个特征的训练样本集，其中

$X_{1}=size(0-2000 feets)$

$X_{2}=$ number of bedrooms(1-5)

此时，X1 是远远大于X2的，所以此时 $J_{\Theta }$ 对应的轮廓图将很瘦很高，如下图所示：

这样造成的结果很可能就是，梯度在下降过程中走了很多的“弯路”，来回震荡，收敛速度很慢，解决办法就是：特征缩放。

特征缩放方法

对于上述例子，我们可以将特征值进行如下转换，即可将两个特征值范围尽可能靠近，甚至相同：

这样， $0<X_{1}\leq 1$ 并且 $0<X_{2}\leq 1$ ，这样的话，最终 $J_{\Theta }$ 的轮廓图像就很“圆”，

这样，梯度下降算法就会很快的收敛。

一般解决方案：均值归一化

假设一个训练集有m个样本，n个属性， $x_{j}^{i}=\frac{x_{j}^{i}-\mu _{x_{j}}}{max(x_{j})}$ 其中 $x_{j}^{i}$ 代表第i个样本的第j个属性的值， $\mu _{x_{j}}$ 代表所有样本第j个属性的值的平均值， $max(x_{j})$ 代表所有样本第j个属性的最大值。下图是教程视频中的解释。

注意，不要用 $x_{0}$ 因为 $x_{0}=1$ 。

也可以将上面的 $x_{j}^{i}=\frac{x_{j}^{i}-\mu _{x_{j}}}{max(x_{j})}$ 用这个式子来替换，其实就是将分母变成了max-min, $x_{j}^{i}=\frac{x_{j}^{i}-\mu_{x_{j}} }{max(x_{j})-min(x_{j})}$

猜你喜欢

转载自blog.csdn.net/qq_31617409/article/details/82726904

特征缩放（feature scaling）

特征缩放 feature scaling

机器学习中的特征缩放（feature scaling）

Spark -- 数据的特征缩放(Feature scaling)

可视化特征缩放（Feature Scaling）

feature scaling

131.006 Unsupervised Learning - Feature Scaling | 非监督学习 - 特征缩放

李宏毅深度学习笔记（三）特征缩放(Feature Scaling)

【读书笔记】Feature Scaling （特征缩放）：归一化、标准化、中心化

浅谈Feature Scaling

数据特征归一化(Feature Scaling)学习及实现

（一）线性回归与特征归一化(feature scaling)

理解normalization||Standardization||Feature scaling

Stanford——机器学习中的特征缩放理解（Features Scaling）

多维缩放(Multiple Dimensional Scaling, MDS)

通俗理解Platt scaling/Platt缩放/普拉特缩放

KNN-距离-数据归一化 Feature Scaling

Linear Regression with multiple variables - Gradient descent in practice I: Feature Scaling

06-数据归一化（Feature Scaling）

多维缩放（MultiDimensional Scaling）——主坐标法（principal coordinate）

ISOMAP算法和MDS(mutiple dimensional scaling)多维缩放

多维缩放（Multiple Dimensional Scaling）MDS-机器学习

Scaling Architecture

Image scaling

Platt scaling

Multidimensional Scaling

第四十九篇入门机器学习——数据归一化（Feature Scaling）

LLMs 缩放指令模型Scaling instruct models FLAN（Fine-tuned LAnguage Net，微调语言网络）

LLMs 缩放法则和计算最优模型Scaling laws and compute-optimal models

【论文阅读】Seeing is Not Believing：Camouflage Attacks on Image Scaling Algorithms（眼见为实:对图像缩放算法的伪装攻击）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)