【数学】梯度下降，牛顿法与拟牛顿法

其他 2018-10-13 15:53:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/kwame211/article/details/82896622

梯度下降

将f(x)f(x)一阶泰勒展开：

f(x)=f(x0)+(x−x0)f′(x0)f(x)=f(x0)+(x−x0)f′(x0)

f(x)=f(x0)+Δxf′(x0)f(x)=f(x0)+Δxf′(x0)

如果当前处于x0x0节点，要使得前进同样的距离使得f(x)f(x)变的最小，则Δx=−δf′(x)Δx=−δf′(x)时

f(x)=f(x0)−δf′2(x0)f(x)=f(x0)−δf′2(x0)

新的f(x)f(x)能够取得下一步的最小值
这也是梯度下降算法为什么沿着梯度进行下降能够取得最小值的证明。
用梯度下降法，每次 xn=xn−1−δf′(x)xn=xn−1−δf′(x)
在多元函数中：

xn=xn−1−δ∇f(x)xn=xn−1−δ∇f(x)

牛顿法

将f(x)f(x)二阶泰勒展开：

f(x)=f(x0)+Δxf′(x0)+12Δx2f′′(x0)f(x)=f(x0)+Δxf′(x0)+12Δx2f″(x0)

因为要使得f(x)f(x)取得最小值，则f′(x)f′(x)在最小值点必为0，将上式两边同时求导得到【其实直接对f′(x)f′(x)进行一阶泰勒展开也可以】

f′(x)=f′(x0)+Δxf′′(x0)f′(x)=f′(x0)+Δxf″(x0)

取f′(x)=0f′(x)=0得到

f′(x0)+Δxf′′(x0)=0f′(x0)+Δxf″(x0)=0

Δx=−f′(x0)f′′(x0)Δx=−f′(x0)f″(x0)

所以用牛顿法，每次取得xn=xn−1−f′(x0)f′′(x0)xn=xn−1−f′(x0)f″(x0)
在多元函数中

xn=xn−1−(∇2f(x0))−1∇f(x0)xn=xn−1−(∇2f(x0))−1∇f(x0)

其中∇2f(x0)∇2f(x0)就是f(x0)f(x0)的海森矩阵【二阶梯度矩阵】

其实，牛顿法在数值分析里面，是用来求解f(x)=0f(x)=0 的解的问题的，相较于二分法求值的一阶收敛速度，牛顿法是一个二阶收敛速度。
用牛顿法求解f(x)=0f(x)=0 的问题的时候，只用一阶导数就好
不过在最优化问题中，需要求解的是最值点，所以找的是其f′(x)=0f′(x)=0的点，所以就用到了二阶导数。

拟牛顿法

拟牛顿法直接看下面参考文献吧
大体思路上来说用牛顿法需要计算Hessian矩阵的逆矩阵，运算复杂度太高（O(n3)O(n3)级别的）。因此，很多牛顿算法的变形出现了，这类变形统称拟牛顿算法。
BFGS是用迭代法去近似计算海森矩阵。
而BFGS需要额外储存近似的那个海森矩阵，这时L-BFGS就出现了，它每次是计算出要计算近似海森矩阵就好。详细的看下面的参考文献吧。

猜你喜欢

转载自blog.csdn.net/kwame211/article/details/82896622

【数学】梯度下降，牛顿法与拟牛顿法

梯度下降、牛顿法、拟牛顿法

梯度下降、牛顿、拟牛顿法

深度学习—梯度下降、牛顿法、拟牛顿法

梯度下降、牛顿法、拟牛顿法详细介绍

梯度下降法，牛顿法，拟牛顿法

梯度下降、牛顿法和拟牛顿法

【机器学习之数学】02 梯度下降法、最速下降法、牛顿法、共轭方向法、拟牛顿法

随机梯度下降，批量梯度下降，牛顿法，拟牛顿法

梯度下降法、随机梯度下降法、批量梯度下降法及牛顿法、拟牛顿法、共轭梯度法

回归优化方法——梯度下降法、牛顿法、拟牛顿法

优化算法之梯度下降法、牛顿法、拟牛顿法实例

【机器学习详解】解无约束优化问题：梯度下降、牛顿法、拟牛顿法

从梯度下降法、牛顿法到拟牛顿法，浅谈它们的联系与区别

一文详解梯度下降法,牛顿法,拟牛顿法

梯度类算法原理：最速下降法、牛顿法和拟牛顿法

梯度下降法&牛顿法

牛顿法与拟牛顿法

常见的几种最优化方法（梯度下降法、牛顿法、拟牛顿法、共轭梯度法等）

优化算法之梯度下降法、牛顿法、拟牛顿法和拉格朗日乘数法

牛顿法、拟牛顿法、高斯-牛顿法、共轭梯度法推导总结

关于梯度下降法和牛顿法的数学推导

深度学习为什么使用梯度下降，而不使用不使用牛顿法或拟牛顿法优化？

拟牛顿法

看看拟牛顿法

梯度下降法、牛顿法及其发展

梯度下降法和牛顿法的联系

梯度下降和牛顿法的区别

机器学习：梯度下降和牛顿法

对比牛顿法、梯度下降法的关系

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)