学习速率 learning rate - 代码天地

学习速率 learning rate

其他 2018-12-12 14:48:18 阅读次数: 0

学习速率的选取策略

运用梯度下降算法进行优化时，权重的更新规则中，在梯度项前会乘以一个系数，这个系数就叫学习速率 $α$ ：

如果学习速率太小，则会使收敛过慢。
如果学习速率太大，则会导致代价函数振荡，迭代过快，梯度下降法可能会越过最低点，甚至可能发散。

学习速率的取值取决于数据样本，可以多取一些值，从大到小，分别运行算法，看看迭代效果，如果损失函数在变小，说明取值有效，否则要增大步长。
例如：把学习速率设置为 0.01，然后观察 training cost 的走向，如果cost 在减小，可以逐步地调大学习速率，试试 0.1，1.0 如果 cost 在增大，那就得减小学习速率，试试0.001，0.0001。经过一番尝试之后，可以大概确定学习速率的合适的值。

学习速率的调节

在优化的过程中，learning rate应该是逐步减小的，越接近“山谷”的时候，迈的“步伐”应该越小。
人工调节

可以先对 learning rate 设置初始值，如：0.25，迭代到一定程度时，如：第20个epoch时候，将 learning rate 除以10，设置为0.025。
自动调节

一个简单有效的做法就是，当验证集的准确率不再提高时，可以让 learning rate 减半或除以10，然后继续迭代。

参考的配置

AlexNet 以及 VGG 中的学习率设定：

学习率初始设定为 0.01，然后当验证集准确率停止改善时，减少10倍。学习率总共降低3次。

The heuristic which we followed was to divide the learning rate by 10 when the validation error rate stopped improving with the current learning rate. The learning rate was initialized at 0.01 and reduced three times prior to termination.

猜你喜欢

转载自blog.csdn.net/lk3030/article/details/84962115

学习速率 learning rate

学习率Learning rate

Deep learning II - II Optimization algorithms - learning rate decay 学习速率衰减

learning rate

机器学习之学习率 Learning Rate

深度学习: 学习率 (learning rate)

学习率衰减 Learning Rate Decay

TensorFlow之二—学习率 (learning rate)

3.1 学习率（learning rate）的选择

学习率衰减/learning rate decay

Adaptive Learning Rate 自适应学习率

learning rate学习率的颠簸问题

学习率(Learning Rate) & 优化器(Optimizer)

Early Stopping与Learning Rate

learning rate 调整方法

learning rate2

pytorch learning rate decay

keras learning rate

decayed_learning_rate

epochs 与 learning rate

Batchsize与learning rate

深度学习：学习率learning rate 的设定规律

深度学习实战（十七）——学习率 (learning rate)的设置

深度学习——形象理解梯度下降、learning rate(学习率)

权重衰减（weight decay）与学习率衰减（learning rate decay）

class5--tensorflow:学习率learning_rate

学习笔记一：learning rate,weight decay和momentum的理解

神经网络的优化（1）----学习率 learning_rate

Dynamic learning rate in training - 培训中的动态学习率

深度学习超参数——momentum、learning rate和weight decay

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)