梯度下降法与牛顿下降法推导

梯度下降法

直观理解

当ω在曲线右半部分,导数>0,ω更新后会变小,向中间靠拢。反之,当ω在曲线左半部分,导数<0,ω更新后会变小,也向中间靠拢。

推导

方法1

泰勒展开,δ是变化量。当δ的方向与f'(x_{k})相同,f'(x_{k}+\delta)最大,因此梯度方向是上升最快的。反之,沿着梯度的负方向下降最快。

方法2

同济高数书第六版P102、P104

牛顿下降法

目的是使得f'(x{0})=0

三阶泰勒展开:

f(x)\approx f(x{0})+f'(x{0})*(x-x{0})+1/2f''(x{0})*(x-x{0})^{2}

求导:

f'(x)=[f(x{0})+f'(x{0})*(x-x{0})+1/2f''(x{0})*(x-x{0})^{2}]'=0

化简:

f'(x{0})+f''(x{0})*(x-x{0})=0

x=x{0}-f'(x{0})/f''(x{0})

猜你喜欢

转载自blog.csdn.net/qq_34599526/article/details/82684239
今日推荐