优化算法optimization：RMSProp

其他 2021-12-11 08:36:46 阅读次数: 0

RMSProp算法

提出动机

在AdaGrad的每次迭代中，因为调整学习率时分母上的变量 $s_t$ 一直在累加按元素平方的小批量随机梯度，所以目标函数自变量每个元素的学习率在迭代过程中一直在降低（或不变）。因此，如果AdaGrad算法没有在前期找到较优解，在迭代后期由于学习率过小更难趋近最优解。

RMSProp算法通过融合指数加权移动平均对这一点进行了改良。简单来说，RMSProp融合了动量法和AdaGrad的优点。

算法

对每次迭代做如下改动
$s_t = \gamma s_{t-1} + (1-\gamma) g_t \circ g_t \\\\ x_t = x_{t-1} - \frac{\eta}{\sqrt{s_t+\epsilon}} \circ g_t$
我们仍然用动量法中用来举例的目标函数观察迭代轨迹。

def rmsprop_2d(x1, x2, s1, s2, eta=0.4, eps=1e-6):
    g1, g2 = 0.2 * x1, 4 * x2
    s1 = gamma * s1 + (1 - gamma) * g1 ** 2
    s2 = gamma * s2 + (1 - gamma) * g2 ** 2
    x1 -= eta / math.sqrt(s1 + eps) * g1
    x2 -= eta / math.sqrt(s2 + eps) * g2
    return x1, x2, s1, s2

学习率为0.4的时候效果已经非常好了。

代码实现

def init_rmsprop_states(dim=2):
    s_w = np.zeros((dim, 1))
    s_b = np.zeros(1)
    return (s_w, s_b)

def rmsprop(params, states, hyperparams, eps=1e-6):
    gamma = hyperparams['gamma']
    for p, s in zip(params, states):
        s[:] = gamma * s + (1 - gamma) * p.grad * p.grad
        p[:] -= hyperparams['lr'] * p.grad / math.sqrt(s + eps)

Reference

Dive Into Deep Learning，第7章

猜你喜欢

转载自blog.csdn.net/qq_40136685/article/details/111189924

优化算法optimization：RMSProp

RMSProp优化算法--学习笔记

优化算法optimization：AdaGrad

优化算法optimization：Adam

优化算法optimization：AdaDelta

深度学习中的优化（动量，RMSProp等算法）

深度学习优化算法：动量、RMSProp、Adam

机器学习中的数学——优化技术：优化算法-[RMSProp]

【pytorch优化器】Adagrad、RMSProp优化算法详解

优化算法总结 -- SGD，Momentum，AdaGrad，RMSProp，Adam

几种优化算法的比较（BGD、SGD、Adam、RMSPROP）

优化算法选择：SGD、SGDM、NAG、Adam、AdaGrad、RMSProp、Nadam

SMO优化算法（Sequential minimal optimization）

【深度学习笔记】优化算法（ Optimization Algorithm）

梯度优化算法（gradient descent optimization algorithms）

粒子群优化算法（Particle Swarm Optimization）

第二周：优化算法 (Optimization algorithms)

优化算法optimization：SGD动量法momentum

Colorization using Optimization：基于优化的上色算法

海鸥优化算法（Seagull Optimization Algorithm，SOA）

白鲸优化算法（Beluga whale optimization，BWO）

算术优化算法（Arithmetic Optimization Algorithm，AOA）

鲸鱼优化算法（Whale Optimization Algorithm，WOA）

进化算法中的粒子群优化算法（Particle Swarm Optimization）

深度学习系列（七）优化算法（梯度下降、动量法、AdaGrad算法、RMSProp算法、AdaDelta算法、Adam算法） 2020.6.24

优化算法比较的实验结果比较（BGD，SGD，MBGD，Momentum，Nesterov，Adagrad，RMSprop）

深度学习——优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

优化梯度下降算法 Momentum、RMSProp(Root mean square propagation)和Adam( Adaptive Moment Estimation)

机器学习中几种优化算法的比较（SGD、Momentum、RMSProp、Adam）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)