梯度下降（Gradient Descent）（三）

其他 2018-09-23 19:57:00 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u012294618/article/details/79509688

在之前的博客中，我们分别讲了梯度下降的基本原理和三种变体。作为当今最流行的优化（optimization）算法（尤其是在深度学习中的应用），梯度下降存在很多问题和挑战，研究人员也相应地提出了许多优化方式，本文将对此作详细的讲解，作为梯度下降系列的最后一篇。

考虑到篇幅过长，且有几篇关于此的文章已经写得非常好，笔者仅在这里给出相应的参考文献及简要介绍，读者可自行前往阅读。
[1]是Sebastian Ruder写的一篇文章，里面详细讲解了关于梯度下降的诸多知识，细致且全面，这里再贴出Ruder的博客地址，供大家学习。
[2]、[3]、[4]均是对[1]的中文翻译，大都翻译的比较通顺，不过缺失了很多公式，英文不好的读者可结合[1]一起看，帮助理解。
最后，在这里贴两张别人制作的动图，对SGD的几种优化方式作了可视化，可直观地感受它们的收敛过程和使用效果：

这里写图片描述

这里写图片描述

参考文献

[1] https://download.csdn.net/download/u012294618/10280896
[2] https://download.csdn.net/download/u012294618/10280894
[3] https://www.jiqizhixin.com/articles/2016-11-21-4
[4] http://www.sohu.com/a/131923387_473283
以上为本文的全部参考文献，对原作者表示感谢。

猜你喜欢

转载自blog.csdn.net/u012294618/article/details/79509688

梯度下降（Gradient Descent）（三）

梯度下降（Gradient Descent）

梯度下降 — Gradient Descent

梯度下降 Gradient Descent

The Gradient Descent---梯度下降（Gradient Descent）

梯度下降（Gradient Descent）小结

梯度下降法 Gradient Descent

（二）梯度下降(Gradient Descent)

3、Gradient Descent（梯度下降）

深入梯度下降(Gradient Descent)

梯度下降（Gradient Descent）（二）

梯度下降（Gradient Descent）（一）

梯度下降法(Gradient descent)

梯度下降算法（Gradient Descent)

梯度下降（gradient descent）原理

Gradient Descent：梯度下降法

梯度下降（Gradient Descent）法

梯度下降算法(Gradient descent)

关于梯度下降（Gradient Descent）的三个tips

ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）

最优化：梯度下降（Gradient Descent）小结

梯度下降小结（Gradient Descent，GD）

Machine Learning：Gradient Descent（梯度下降法）

机器学习：梯度下降gradient descent

机器学习笔记——梯度下降（Gradient Descent）

Gradient descent algorithm 梯度下降法

gradient descent梯度下降算法的优化

机器学习1：梯度下降（Gradient Descent）

（二）深入梯度下降(Gradient Descent)算法

【机器学习】梯度下降（Gradient Descent）小结

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)