人工智能-优化算法之动量法 - 代码天地

人工智能-优化算法之动量法

企业开发 2023-12-16 19:13:22 阅读次数: 0

对于嘈杂的梯度，我们在选择学习率需要格外谨慎。如果衰减速度太快，收敛就会停滞。相反，如果太宽松，我们可能无法收敛到最优解。

泄漏平均值

小批量随机梯度下降作为加速计算的手段。它也有很好的副作用，即平均梯度减小了方差。小批量随机梯度下降可以通过以下方式计算：

为了保持记法简单，在这里我们使用时间 $t-1$ 时更新的权重 $t-1$ 。如果我们能够从方差减少的影响中受益，甚至超过小批量上的梯度平均值，那很不错。完成这项任务的一种选择是用泄漏平均值（leaky average）取代梯度计算：

其中 $\beta \epsilon (0,1)$ 。这有效地将瞬时梯度替换为多个“过去”梯度的平均值。 $V$ 被称为动量（momentum），它累加了过去的梯度。为了更详细地解释，让我们递归地将 $V_{t}$ 扩展到

其中，较大的 $\beta$ 相当于长期平均值，而较小的 $\beta$ 相对于梯度法只是略有修正。新的梯度替换不再指向特定实例下降最陡的方向，而是指向过去梯度的加权平均值的方向。这使我们能够实现对单批量计算平均值的大部分好处，而不产生实际计算其梯度的代价。

上述推理构成了“加速”梯度方法的基础，例如具有动量的梯度。在优化问题条件不佳的情况下（例如，有些方向的进展比其他方向慢得多，类似狭窄的峡谷），“加速”梯度还额外享受更有效的好处。此外，它们允许我们对随后的梯度计算平均值，以获得更稳定的下降方向。诚然，即使是对于无噪声凸问题，加速度这方面也是动量如此起效的关键原因之一。

猜你喜欢

转载自blog.csdn.net/weixin_43227851/article/details/134702594

人工智能-优化算法之动量法

算法之美-回溯法与人工智能

人工智能-优化算法之凸集

人工智能-优化算法之梯度下降

人工智能——微粒群优化算法

【AI人工智能】：白话机器学习之（五）最优化方法-牛顿法

优化算法optimization：SGD动量法momentum

人工智能之常见算法

人工智能之GAN算法

人工智能---A*算法

人工智能 —— A*算法

人工智能 —— A算法

动量优化法

人工智能优化算法-梯度下降法

人工智能7-蚁群优化算法实验

人工智能9—粒子群优化算法实验

人工智能粒子群优化三大算法

人工智能-优化算法之学习率调度器

最优化算法Nesterov Momentum牛顿动量法

人工智能-免疫算法

人工智能涉及算法

人工智能卷积算法

人工智能的灵魂——算法

人工智能之机器学习常见算法

人工智能之机器学习算法体系汇总

人工智能之算法知识与实战篇

人工智能之机器学习CART算法解析

人工智能之机器学习常用算法总结

人工智能之口罩检测算法

人工智能（算法）化之基础 -- 爬虫python入门

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)