深度学习为什么使用梯度下降，而不使用不使用牛顿法或拟牛顿法优化？ - 代码天地

深度学习为什么使用梯度下降，而不使用不使用牛顿法或拟牛顿法优化？

其他 2020-04-06 16:42:34 阅读次数: 0

	梯度下降法 (SGD 为例)	牛顿法	拟牛顿法
时间复杂度 (单次迭代)	只需计算 1 阶导，时间复杂度低，为 O(n)	需计算 Hessian 矩阵及其逆，时间复杂度高，为 O(n3)	用正定矩阵近似 Hessian 矩阵的逆，时间复杂度为 O(n2)
收敛速度	收敛慢，迭代次数大	收敛快，迭代次数小	收敛快，迭代次数小
初始值要求	无太强要求，容易逃离鞍点	对初始值有一定要求，非凸问题容易陷入鞍点 (牛顿法步长会越来越小
应用场景	特征维度较大的场景，如特征数 > 10k	特征维度较小的场景	需满足拟牛顿条件，更适合凸问题

在神经网络（非凸问题）的训练中，大多数都采用梯度下降法一族方法。而在训练逻辑回归（凸问题）等模型时，可采用梯度下降和拟牛顿方法。

参考梯度下降法、牛顿法、拟牛顿法三类迭代法应用场景有何差别？

烟雨人长安

发布了25 篇原创文章 · 获赞 1 · 访问量 1429

私信关注

猜你喜欢

转载自blog.csdn.net/Matrix_cc/article/details/104925726

深度学习为什么使用梯度下降，而不使用不使用牛顿法或拟牛顿法优化？

深度学习—梯度下降、牛顿法、拟牛顿法

梯度下降、牛顿法、拟牛顿法

为什么深度学习不采用牛顿法或拟牛顿法作为优化算法？

梯度下降、牛顿、拟牛顿法

【机器学习详解】解无约束优化问题：梯度下降、牛顿法、拟牛顿法

梯度下降、牛顿法、拟牛顿法详细介绍

梯度下降法，牛顿法，拟牛顿法

【数学】梯度下降，牛顿法与拟牛顿法

梯度下降、牛顿法和拟牛顿法

回归优化方法——梯度下降法、牛顿法、拟牛顿法

优化算法之梯度下降法、牛顿法、拟牛顿法实例

常见的几种最优化方法（梯度下降法、牛顿法、拟牛顿法、共轭梯度法等）

【机器学习之数学】02 梯度下降法、最速下降法、牛顿法、共轭方向法、拟牛顿法

优化算法之梯度下降法、牛顿法、拟牛顿法和拉格朗日乘数法

随机梯度下降，批量梯度下降，牛顿法，拟牛顿法

为什么不用牛顿法来代替梯度下降算法？

梯度下降法、随机梯度下降法、批量梯度下降法及牛顿法、拟牛顿法、共轭梯度法

机器学习：梯度下降和牛顿法

牛顿法使用总结

深度学习基础：数值计算与优化(二)_基于梯度的二阶优化算法_Jacobian矩阵_Hessian矩阵_牛顿法_拟牛顿法_DFP_BFGS

从梯度下降法、牛顿法到拟牛顿法，浅谈它们的联系与区别

一文详解梯度下降法,牛顿法,拟牛顿法

梯度类算法原理：最速下降法、牛顿法和拟牛顿法

最优化算法之牛顿法与拟牛顿法学习

优化 -牛顿法，拟牛顿条件

梯度下降法&牛顿法

牛顿法（二阶梯度法）和拟牛顿法优化

牛顿法与拟牛顿法

凸优化学习：使用python实现梯度下降和牛顿法，以优化二元二次凸函数（无约束项）为例

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)