深度学习：学习率learning rate 的设定规律 - 代码天地

深度学习：学习率learning rate 的设定规律

其他 2018-05-29 16:07:46 阅读次数: 1

Introduction

学习率 (learning rate)，控制模型的学习进度：
这里写图片描述

学习率大小

	学习率大	学习率小
学习速度	快	慢
使用时间点	刚开始训练时	一定轮数过后
副作用	1.易损失值爆炸；2.易振荡。	1.易过拟合；2.收敛速度慢。

学习率设置

在训练过程中，一般根据训练轮数设置动态变化的学习率。

刚开始训练时：学习率以 0.01 ~ 0.001 为宜。
一定轮数过后：逐渐减缓。
接近训练结束：学习速率的衰减应该在100倍以上。

Note：
如果是迁移学习，由于模型已在原始数据上收敛，此时应设置较小学习率 (≤10−4) 在新数据上进行微调。

学习率减缓机制

	轮数减缓	指数减缓	分数减缓
英文名	step decay	exponential decay	1/t decay
方法	每N轮学习率减半	学习率按训练轮数增长指数插值递减	lrt=lr0/(1+kt) ，k 控制减缓幅度，t 为训练轮数

把脉目标函数损失值曲线

理想情况下曲线应该是滑梯式下降 [绿线]：
这里写图片描述

曲线初始时上扬 [红线]：
Solution：初始学习率过大导致振荡，应减小学习率，并从头开始训练。
曲线初始时强势下降没多久归于水平 [紫线]：
Solution：后期学习率过大导致无法拟合，应减小学习率，并重新训练后几轮。
曲线全程缓慢 [黄线]：
Solution：初始学习率过小导致收敛慢，应增大学习率，并从头开始训练。

[1]解析卷积神经网络—深度学习实践手册

[2]调整学习速率以优化神经网络训练

猜你喜欢

转载自blog.csdn.net/qq_33485434/article/details/80452941

深度学习：学习率learning rate 的设定规律

深度学习: 学习率 (learning rate)

学习率Learning rate

深度学习实战（十七）——学习率 (learning rate)的设置

深度学习——形象理解梯度下降、learning rate(学习率)

机器学习之学习率 Learning Rate

学习率衰减 Learning Rate Decay

TensorFlow之二—学习率 (learning rate)

3.1 学习率（learning rate）的选择

学习率衰减/learning rate decay

学习率(Learning Rate) & 优化器(Optimizer)

learning rate学习率的颠簸问题

Adaptive Learning Rate 自适应学习率

【深度学习】学习率预热和学习率衰减 (learning rate warmup & decay)

学习速率 learning rate

深度学习参数更新--自适应的学习率（Adative Learning Rate）

learning rate

权重衰减（weight decay）与学习率衰减（learning rate decay）

class5--tensorflow:学习率learning_rate

神经网络的优化（1）----学习率 learning_rate

Dynamic learning rate in training - 培训中的动态学习率

周期性学习率(Cyclical Learning Rate)技术

PyTorch如何获取当前的学习率Learning Rate(lr)

学习率调整策略，学习率预热（warmup）和学习率衰减（Learning Rate Decay）

学习率Learn_rate是什么（深度学习）

04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

深度学习超参数——momentum、learning rate和weight decay

准确率rate

Early Stopping与Learning Rate

learning rate 调整方法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)