神经网络学习率（learning rete）的控制 - 代码天地

神经网络学习率（learning rete）的控制

编程语言 2018-04-26 11:22:09 阅读次数: 2

一、学习率衰减的概念和必要性

学习率过大，在算法优化的前期会加速学习，使得模型更容易接近局部或全局最优解。但是在后期会有较大波动，甚至出现损失函数的值围绕最小值徘徊，波动很大，始终难以达到最优，如下图蓝色曲线所示。所以引入学习率衰减的概念，直白点说，就是在模型训练初期，会使用较大的学习率进行模型优化，随着迭代次数增加，学习率会逐渐进行减小，保证模型在训练后期不会有太大的波动，从而更加接近最优解，如下图绿色上面一条线所示。

当学习率过大，以J(X)=X^2为例，学习率始终为1，梯度下降算法的运行过程：

可以看到无论进行多少轮迭代，参数始终在5和-5之间摇摆，而不是收敛到一个极小值。

二、学习率衰减的类型

学习率衰减的类型有很多种，大致可以分为两类：

一是通过人为经验进行设定，如到达多少轮后，设定具体的学习率为多少；二是随着迭代轮数的增加学习率自动发生衰减，这类有比较常用的指数型衰退，具体算法如下图

在tensorflow中指数型衰减通过调用tf.train.exponential_decay(learning_rate, global_step, decay_steps, decay_rate, staircase=False, name=None)实现。

其中decayed_learning_rate为每一轮优化时使用的学习率，learning_rate为事先设定的初始学习率，decay_rate为衰减系数，decay_steps为衰减速度，staircase=True时，global_step/decay_steps会被转化为整数，这使得学习率呈阶梯型下降（如下图黑色），若staircase=False，为连续型下降。

猜你喜欢

转载自blog.csdn.net/lvchunyang66/article/details/80090708

神经网络学习率（learning rete）的控制

Rete

Rete算法学习笔记

神经网络的优化（1）----学习率 learning_rate

神经网络控制学习笔记——神经网络背景2

神经网络控制学习笔记——神经网络背景1

PID神经网络控制

神经网络学习3--Session 会话控制

神经网络优化-学习率

神经网络学习率设置

Tensorflow之神经网络学习率

Neural Networks Learning(神经网络学习)

神经网络优化-----学习率（指数衰减学习率）

基于BP神经网络的PID控制

倒立摆的DQN神经网络控制

神经网络预测控制核电,神经网络预测控制代码

神经网络控制学习笔记——系统动力学背景

【源码】基于人工神经网络的非线性液位系统强化学习控制

MATLAB强化学习入门——五、倒立摆的DQN神经网络控制

【智能控制三】神经网络控制器设计

神经网络优化学习-——损失函数学习率

机器学习——神经网络关于学习率的调优

【Machine learning】神经网络

【神经网络PID】基于simulink的神经网络PID控制器仿真

基于神经网络的预测控制,神经网络理论预测模型

【模糊神经网络】基于simulink的模糊神经网络控制器设计

神经网络模糊pid控制算法,模糊神经网络应用实例

神经网络在游戏中的应用,神经网络控制应用实例

神经网络控制系统的应用,神经网络的应用实例

神经网络与模糊控制,稀疏神经网络是什么

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)