深度学习实战（十七）——学习率 (learning rate)的设置

其他 2020-04-24 15:08:34 阅读次数: 0

Introduction

学习率 (learning rate)，控制模型的 学习进度 ：
这里写图片描述

lr 即 stride (步长) ，即反向传播算法中的 η ：

学习率大小

	学习率大	学习率小
学习速度	快	慢
使用时间点	刚开始训练时	一定轮数过后
副作用	1.易损失值爆炸；2.易振荡。	1.易过拟合；2.收敛速度慢。

学习率设置

在训练过程中，一般根据训练轮数设置动态变化的学习率。

刚开始训练时：学习率以 0.01 ~ 0.001 为宜。
一定轮数过后：逐渐减缓。
接近训练结束：学习速率的衰减应该在100倍以上。

Note：
如果是 迁移学习 ，由于模型已在原始数据上收敛，此时应设置较小学习率 (≤10−4≤10−4) 在新数据上进行微调。

学习率减缓机制

	轮数减缓	指数减缓	分数减缓
英文名	step decay	exponential decay	1/t decay
方法	每N轮学习率减半	学习率按训练轮数增长指数插值递减	，k 控制减缓幅度，t 为训练轮数

把脉目标函数损失值曲线

理想情况下曲线应该是 滑梯式下降 [绿线]：

曲线 初始时上扬 [红线]：

Solution：初始学习率过大导致振荡，应减小学习率，并 从头开始训练 。

曲线 初始时强势下降没多久归于水平 [紫线]：

Solution：后期学习率过大导致 无法拟合，应减小学习率，并 重新训练后几轮 。

曲线 全程缓慢 [黄线]：

Solution：初始学习率过小导致 收敛慢，应增大学习率，并 从头开始训练 。

参考：

[1] 解析卷积神经网络—深度学习实践手册
[2] 调整学习速率以优化神经网络训练
[3] 如何找到最优学习率

转自：

深度学习: 学习率 (learning rate)

马大哈先生

发布了150 篇原创文章 · 获赞 200 · 访问量 37万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37764129/article/details/101522154

深度学习实战（十七）——学习率 (learning rate)的设置

学习率Learning rate

深度学习: 学习率 (learning rate)

深度学习：学习率learning rate 的设定规律

深度学习——形象理解梯度下降、learning rate(学习率)

学习速率 learning rate

机器学习之学习率 Learning Rate

学习率衰减 Learning Rate Decay

TensorFlow之二—学习率 (learning rate)

3.1 学习率（learning rate）的选择

学习率衰减/learning rate decay

学习率(Learning Rate) & 优化器(Optimizer)

learning rate学习率的颠簸问题

Adaptive Learning Rate 自适应学习率

【深度学习】学习率预热和学习率衰减 (learning rate warmup & decay)

深度学习参数更新--自适应的学习率（Adative Learning Rate）

权重衰减（weight decay）与学习率衰减（learning rate decay）

class5--tensorflow:学习率learning_rate

神经网络的优化（1）----学习率 learning_rate

Dynamic learning rate in training - 培训中的动态学习率

周期性学习率(Cyclical Learning Rate)技术

PyTorch如何获取当前的学习率Learning Rate(lr)

学习率调整策略，学习率预热（warmup）和学习率衰减（Learning Rate Decay）

learning rate

04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

深度学习超参数——momentum、learning rate和weight decay

深度模型训练之learning rate

TensorFlow使用记录 (三）： Learning rate tensorflow中常用学习率更新策略

使用Pytorch实现学习率衰减/降低（learning rate decay）

【转载】权重衰减（weight decay）与学习率衰减（learning rate decay）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)