机器学习 day07（特征缩放） - 代码天地

机器学习 day07（特征缩放）

物联网 2023-06-18 19:27:24 阅读次数: 0

1. 特征缩放的作用

特征缩放可以让梯度下降算法运行的更快
特征：X 对应的参数：W
当一个特征的可能值范围很大时，一个好的模型会选择一个相对较小的对应参数值，因为W₁的一个非常小的变化会给估计价格产生非常大的影响，同时也会对成本函数J产生非常大的影响。
同样，当一个特征的可能值范围很小时，一个好的模型会选择一个相对较大的对应参数值，而W₂需要非常大的变化才能给估计价格产生非常大的影响，对成本函数J也是如此。如图：
当两个特征的可能值范围差距过大时，所对应的参数的可能值范围差距也会过大，产生的成本函数的等高线图为椭圆形，如图：
若J函数的等高线图为椭圆形，又高又瘦时，会让梯度下降算法在运行时来回横跳很长一段时间，才能找到J函数的全局最小值。
此时，我们可以进行特征缩放，即对训练数据进行一些转换，使特征的可能值范围都是彼此可比较的。用转换后的数据重新画成本函数J的等高线图，J函数为圆形，此时采用梯度下降算法，可以找到一条更直接的通往全局最小值的路，不会再左右横跳浪费时间了。如图：

2. 常见的特征缩放方法

除以最大值法：
将特征的可能值均除以可能值范围的最大值
均值归一化：
特征的可能值以前可能都大于零，进行均值归一化后，可以使特征的可能值会围绕零点，既有负值又有正值
步骤：首先求某特征的平均值，再将该特征的可能值先减去该特征的平均值，再除以，可能值范围的最大值与最小值的差。如图：
Z-score 标准化：
步骤：先计算某特征的标准差和平均值，再将该特征的可能值减该特征的平均值，除以该特征的标准差。如图：
标准差与平均值的计算公式：
平均值

3. 是否需要特征缩放

取决于特征之间的取值范围是否相近，太大或太小的需要特征缩放，但并不一定都要缩放到[-1，1]，如图：

猜你喜欢

转载自blog.csdn.net/u011453680/article/details/130282493

机器学习 day07（特征缩放）

java学习day07

python学习day07

python 学习DAY07

python学习——day07

js学习-day07

day07 学习小结

前端学习--Day07

JavaEE学习 day07

机器学习---特征缩放

python学习day07 作业总结

Python学习笔记_day07

学习日记day07 coreldraw

JavaSe学习总结_day07

python学习之路--day07

python学习之路day07

C语言基础学习day07

ElasticSearch学习之路-day07

2019.07.22(day07)学习笔记（爬虫）

day07 python学习之爬虫

java基础学习day07

Kali学习笔记 - day07

自动化学习-Day07

爬虫学习笔记day07

Java EE day07学习总结

Python学习笔记——Day07

C语言学习Day07

安卓学习日志 Day07

LiangGaRy-学习笔记-Day07

机器学习之特征缩放

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)