主要DL Optimizer原理与Tensorflow相关API

其他 2019-01-02 16:04:38 阅读次数: 0

V(t) = y*V(t-1) + learning_rate*G(x)
x(t) = x(t-1) - V(t)

参考：https://arxiv.org/pdf/1609.04747.pdf

DL训练面临的典型困难

普通的小批梯度下降法并不能保证很好的收敛性，但它提出了一些需要解决的挑战:选择合适的学习率可能是困难的。
学习速率过小会导致收敛速度过慢，而学习速率过大会阻碍收敛，导致损失函数在最小值附近波动甚至发散。
一种办法，可以在训练过程中调整学习率，例如退火，即根据预先定义的计划表减少学习率，或当各时期之间目标的变化低于阈值时。然而，这些进度表和阈值必须提前定义，因此不能适应数据集的特点，此外，相同的学习率适用于所有参数更新。如果我们的数据是稀疏的，并且我们的特征具有非常不同的频率，我们可能不希望将它们全部更新到相同的程度，而是对很少发生的特征就行更大的更新。
最小化神经网络中常见的高度非凸误差函数的另一个关键挑战是避免陷入大量次优局部极小值。Dauphin等人的[5]认为，这种困难实际上不是来自于局部极小值，而是来自鞍点，即一维向上、一维向下倾斜的点。这些鞍点通常被相同误差的平台所包围，这使得SGD很难逃脱，因为梯度在所有维度上都接近于零。

Mini-batch gradient descent

　　这是ML训练基本原理。一般不用直接梯度下降法就行训练

tf.train.GradientDescentOptimizer

Momentum（动量法）

更新公式如下，其中η为学习率（一般为0.9），用法：

tf.train.MomentumOptimizer

　　　　　　　　

Nesterov accelerated gradient（NAG）

更新公式如下，用法：

Adaptive Moment Estimation (Adam)

tf.train.AdamOptimizer

猜你喜欢

转载自www.cnblogs.com/xbit/p/10208753.html

主要DL Optimizer原理与Tensorflow相关API

DL相关概念汇总

DL学习笔记-TensorFlow概念

DL

React主要Api 实现原理（一）

DL实战(2)：SiamFC - TensorFlow配置

TensorFlow 1.11.0 主要更新

DL相关论文翻译与理解汇总

DL课程：CNN及相关应用案例代码

DL ML CNN 相关的经验之谈

【454】ML-DL相关链接

DL相关基础概念-待补充

tensorflow Optimizer

Lucene主要API介绍

深度学习基础--DL原理研究2

深度学习基础--DL原理研究1

Linux文件操作的主要接口API及相关细节

PostgreSQL 主要模块原理

【Tensorflow_DL_Note9】Tensorflow源代码解读1

【AI】TensorFlow - 相关 API

TensorFlow — 相关 API

TensorFlow2.0主要特性

文件操作的主要接口API

Zookeeper主要的原生API介绍

StampedLock主要API实现浅析

DL实战1：tensorflow在mnist上实现siamese net

DL10--TensorFlow的55个经典案例

外星人dl踩坑记04——tensorflow

ML&DL&RL：ML&DL相关概念的原始英文解释——对理解最初的ML和DL的相关概念的定义非常有用

DL课程：RNN、LSTM、GRU及相关应用案例代码

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)