归一化能够加速训练的原因 - 代码天地

归一化能够加速训练的原因

其他 2020-02-29 22:50:47 阅读次数: 0

这里引用吴恩达教授在课程中的截图。

一、 w，b分布

我们首先分析一下为什么非归一化的的cost呈现这种分布。

对于一个没有归一化的数据，X和Y可能呈现很大的数量级差距，如果X相较于Y非常大的话，改变W对Z的影响将会相对b来说非常大。

举个例子，如果Y在0,1之间，而X在100000以上，在梯度下降的过程中，w将会变化极小，因为稍微变化百分之一，都可能造成cost变化非常大。

二、梯度下降

我们再分析一下，梯度下降的过程会发生什么。对于第一个图，如果我们在图中标识的起始点，我们的梯度并没有指向最优点。所以在梯度下降的过程中，迭代结果可能并不是有效的，甚至变得更加糟糕。

而相反，我们从第二图中可以看出，在圆中的任意一点，我们的梯度下降的方向均是指向最优解，这让我们的迭代变得更加高效。

以上是归一化加速训练的原因。

猜你喜欢

转载自www.cnblogs.com/siyuan-Jin/p/12386644.html

归一化能够加速训练的原因

归一化的本质原因

译文 | 批量归一化通过减少内部协变量转移加速深度网络训练

数据归一化（或者标准化，注意归一化和标准化不同）的原因:

Java蓝桥杯算法训练复数归一化

批量归一化

数据归一化

矩阵归一化

LRN归一化

图像归一化

归一化的作用

归一化

复数归一化

归一化随笔

批归一化

特征归一化

颜色归一化

softmax 归一化

属性的归一化

torch归一化

归一化笔记

图片归一化

归一化（Normalization）

归一化与正则化

【转载】05图像处理前的one-hot编码和归一化原因

第六讲-训练神经网络上--课时15--批量归一化

机器学习中训练集和测试集归一化（matlab版）

机器学习中训练集和测试集归一化-matlab

CANN训练：模型推理时数据预处理方法及归一化参数计算

深度学习技巧应用12-神经网络训练中批归一化的应用

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)