learning rate学习率的颠簸问题 - 代码天地

learning rate学习率的颠簸问题

企业开发 2023-04-09 21:24:38 阅读次数: 0

一、问题简介

学习率过大会导致在最优的点附近颠簸，无法收敛到最优，二学习率太小又会造成收敛速度过慢的问题。

二、直观感受

我们利用tensorflow2.0来直观感受这一问题：

代码：

import tensorflow as tf

w = tf.Variable(tf.constant(5, dtype=tf.float32))
lr = 0.2
epoch = 40

for epoch in range(epoch):  # for epoch 定义顶层循环，表示对数据集循环epoch次，此例数据集数据仅有1个w,初始化时候constant赋值为5，循环40次迭代。
    with tf.GradientTape() as tape:  # with结构到grads框起了梯度的计算过程。
        loss = tf.square(w + 1)
    grads = tape.gradient(loss, w)  # .gradient函数告知谁对谁求导

    w.assign_sub(lr * grads)  # .assign_sub 对变量做自减 即：w -= lr*grads 即 w = w - lr*grads
    print("After %s epoch,w is %f,loss is %f" % (epoch, w.numpy(), loss))

结果：

（学习率0.2时）：很快收敛

学习率为0.009时：收敛速度很慢

学习率为0.99时：在最优结果左右反复变化

扫描二维码关注公众号，回复： 14824559 查看本文章

因此，学习率是影响爱戴结果的重要因素，如何解决这一问题，有很多种方法比如adam，adagrad等等，参考另一篇博客：

https://mp.csdn.net/mp_blog/creation/editor/118712546

猜你喜欢

转载自blog.csdn.net/qq_46006468/article/details/119357930

learning rate学习率的颠簸问题

学习率Learning rate

机器学习之学习率 Learning Rate

深度学习: 学习率 (learning rate)

学习率衰减 Learning Rate Decay

TensorFlow之二—学习率 (learning rate)

3.1 学习率（learning rate）的选择

学习率衰减/learning rate decay

Adaptive Learning Rate 自适应学习率

学习率(Learning Rate) & 优化器(Optimizer)

学习速率 learning rate

深度学习：学习率learning rate 的设定规律

深度学习实战（十七）——学习率 (learning rate)的设置

深度学习——形象理解梯度下降、learning rate(学习率)

权重衰减（weight decay）与学习率衰减（learning rate decay）

class5--tensorflow:学习率learning_rate

神经网络的优化（1）----学习率 learning_rate

Dynamic learning rate in training - 培训中的动态学习率

周期性学习率(Cyclical Learning Rate)技术

PyTorch如何获取当前的学习率Learning Rate(lr)

学习率调整策略，学习率预热（warmup）和学习率衰减（Learning Rate Decay）

learning rate

【深度学习】学习率预热和学习率衰减 (learning rate warmup & decay)

深度学习参数更新--自适应的学习率（Adative Learning Rate）

TensorFlow使用记录 (三）： Learning rate tensorflow中常用学习率更新策略

使用Pytorch实现学习率衰减/降低（learning rate decay）

【转载】权重衰减（weight decay）与学习率衰减（learning rate decay）

Early Stopping与Learning Rate

learning rate 调整方法

learning rate2

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)