深度学习《CNN架构续篇 - 学习率衰减》 - 代码天地

深度学习《CNN架构续篇 - 学习率衰减》

其他 2020-10-25 08:41:40 阅读次数: 0

截图来自于吴恩达的深度学习视频。

我们在参数更新的时候，存在一个步长α，这个参数代表了我们每一轮迭代在梯度方向上要进步的步伐长度，以前呢骂我们都是设置成规定值，那么有什么影响呢？首先简单不用说了，在某个梯度下降的过程中，在谷底（梯度最低值）的时候，可能出现始终徘徊到达不了最低点，甚至反而出现越来越大不收敛的情况，原因就是步长一致导致的，因此有个优化方式就是，将固定的步长α改成变化的值，怎么变呢？
如下图，在固定步长下，在最优值附近会产生剧烈抖动，可能无法达到最优解。
在这里插入图片描述

1）随着迭代次数的增长逐渐减少，使用反函数形式衰减。
a) 在这里插入图片描述

b) 在这里插入图片描述

c) 在这里插入图片描述

2）随着梯度的值减少，梯度越大，说明坡度越大，那就采取大一些的值，越接近谷底，坡度越缓，就越要变化为小步伐前进。（不详细讲解）
3）梯度衰减（不详细讲解）
4）余弦衰减（不详细讲解）
5）多项式衰减（不详细讲解）
6）指数衰减
a) 在这里插入图片描述

使用学习率衰减后，得到的效果就是绿色线条表示，越接近最优值步长越小，越容易接近最优值：

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_29367075/article/details/108913309

深度学习《CNN架构续篇 - 学习率衰减》

深度学习《CNN架构续篇 - BatchNorm》

深度学习《CNN架构续篇 - 正则化》

2.2.6 学习率衰减

指数衰减学习率

学习率衰减总结

指数衰减-学习率

学习率的衰减策略

深度学习《CNN架构续篇 - 梯度下降的优化》

学习率 - 指数衰减法

指数衰减学习率的staircase

TensorFlow入门：学习率衰减

[tf]学习率指数衰减

TensorFlow笔记--学习率衰减

Dropout和学习率衰减

学习率及其指数衰减

tensorflow学习率自动衰减

PyTorch余弦学习率衰减

学习率衰减方法

权重衰减（weight decay）与学习率衰减（learning rate decay）

pytorch 学习率衰减机制学习笔记

【Tensorflow】设置自动衰减的学习率

Tensorflow实现学习率衰减

训练过程--学习率与权重衰减

caffe中的学习率的衰减机制

学习率衰减 Learning Rate Decay

tensorflow训练，带bn，学习率衰减

学习率衰减/learning rate decay

TensorFlow——学习率衰减的使用方法

tensorflow2.0学习率衰减

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)