为什么深度学习不采用牛顿法或拟牛顿法作为优化算法？ - 代码天地

为什么深度学习不采用牛顿法或拟牛顿法作为优化算法？

其他 2018-06-23 03:08:40 阅读次数: 2

出处：http://blog.csdn.net/VictoriaW/article/details/71710280
原因一：牛顿法需要用到梯度和Hessian矩阵，这两个都难以求解。因为很难写出深度神经网络拟合函数的表达式，遑论直接得到其梯度表达式，更不要说得到基于梯度的Hessian矩阵了。
原因二：即使可以得到梯度和Hessian矩阵，当输入向量的维度N较大时，Hessian矩阵的大小是N×N，所需要的内存非常大。
原因三：在高维非凸优化问题中，鞍点相对于局部最小值的数量非常多，而且鞍点处的损失值相对于局部最小值处也比较大。而二阶优化算法是寻找梯度为0的点，所以很容易陷入鞍点。

猜你喜欢

转载自blog.csdn.net/u011094454/article/details/79256147

为什么深度学习不采用牛顿法或拟牛顿法作为优化算法？

深度学习为什么使用梯度下降，而不使用不使用牛顿法或拟牛顿法优化？

最优化算法之牛顿法与拟牛顿法学习

深度学习—梯度下降、牛顿法、拟牛顿法

【机器学习算法】牛顿法和拟牛顿法

优化 -牛顿法，拟牛顿条件

牛顿法与拟牛顿法学习笔记（四）BFGS 算法

牛顿法与拟牛顿法

牛顿法与拟牛顿法学习笔记（一）牛顿法

牛顿法与拟牛顿法学习笔记

深度学习基础：数值计算与优化(二)_基于梯度的二阶优化算法_Jacobian矩阵_Hessian矩阵_牛顿法_拟牛顿法_DFP_BFGS

优化算法——拟牛顿法之DFP算法

牛顿法与拟牛顿法(四) BFGS 算法

无约束优化算法——牛顿法与拟牛顿法（DFP，BFGS，LBFGS）

优化算法之梯度下降法、牛顿法、拟牛顿法实例

机器学习-牛顿法和拟牛顿法

拟牛顿法

看看拟牛顿法

【机器学习详解】解无约束优化问题：梯度下降、牛顿法、拟牛顿法

最优化学习笔记(十七)——拟牛顿法(3)

最优化学习笔记(十六)——拟牛顿法(2)

最优化学习笔记（十五）——拟牛顿法(1)

机器学习中的数学——优化技术：优化算法-[拟牛顿法（Quasi-Newton Methods）]

《最优化导论》-11拟牛顿法

梯度下降、牛顿法、拟牛顿法

牛顿法与拟牛顿法（一）

牛顿法及拟牛顿法笔记

牛顿法和拟牛顿法

牛顿法与拟牛顿法详解

牛顿法与拟牛顿法(一)

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)