2.2.6 学习率衰减

其他 2018-05-27 12:53:41 阅读次数: 0

学习率衰减

加快神经网络的另一个办法就是随着时间推移慢慢减少学习率。我们将这个称之为学习率衰减。

这里写图片描述

如图中蓝色线所示，当mini-batch不大的时候，噪声会比较明显。最后不会精确地收敛，而是在最小值附近不断地波动。但是如果我们不断减少学习率，最后情况就如同图中绿线所示，最后会在最小值附近很小的一块区域不断波动，而不会在比较大的区域里。

减小学习率的方法如下：

这里写图片描述

我们需要在第一代的时候遍历一遍数据，第一次遍历整个数据集称为第一代，第二次遍历整个数据集称为第二代。我们一般的计算公式是

α = \frac{1}{1 + d e c a y - r a t e * e p o c h - n u m} * α_{0}

$\alpha = \frac{1}{1+decay-rate*epoch-num}*\alpha_0$
其中decay-rate称为衰减率，这个也是我们需要调整的超参数。从图中我们可以看到，如果decay-rate的值是1，随着epoch-num的数值不断增加，学习率在不断下降。

除了这个学习率衰减公式，还有别的衰减公式。
这里写图片描述

吴教主深度学习和神经网络课程总纲

猜你喜欢

转载自blog.csdn.net/einstellung/article/details/80061317

2.2.6 学习率衰减

2.2.6

指数衰减学习率

学习率衰减总结

指数衰减-学习率

学习率的衰减策略

python 3.6 + Django 2.2.6 + Mysql：Web环境搭建、学习笔记

2.2.6 集合

学习率 - 指数衰减法

指数衰减学习率的staircase

TensorFlow入门：学习率衰减

[tf]学习率指数衰减

TensorFlow笔记--学习率衰减

Dropout和学习率衰减

学习率及其指数衰减

tensorflow学习率自动衰减

PyTorch余弦学习率衰减

学习率衰减方法

权重衰减（weight decay）与学习率衰减（learning rate decay）

pytorch 学习率衰减机制学习笔记

2.2.6 onDestroy()销毁地图

NCRE 2.2.5&2.2.6

Spring Boot 2.2.6

Spring Data MongoDB 2.2.6

Spring Data JPA 2.2.6

Spring Data LDAP 2.2.6

Spring Data Redis 2.2.6

【Tensorflow】设置自动衰减的学习率

Tensorflow实现学习率衰减

训练过程--学习率与权重衰减

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)