梯度下降法中负梯度方向是最速下降方向的原因

梯度下降法中负梯度方向是最速下降方向的原因

flyfish

1 三角函数中的特殊值 主要是看Cos的值
Cos

2 看一个余弦定理
对于任意三角形,任何一边的平方等于其他两边平方的和减去这两边与它们夹角的余弦的两倍积
c 2 = a 2 + b 2 2 a b cos C

或者是
cos C = a 2 + b 2 c 2 2 a b .

余弦定理的使用
O A B 中, | B A | 2 = | O A | 2 + | O B | 2 2 ; | O A | ; | O B | cos θ

| B A | 2 = ( x 1 x 2 ) 2 + ( y 1 y 2 ) 2

| O A | 2 = x 1 2 + y 1 2 | O B | 2 = x 2 2 + y 2 2

( x 1 x 2 ) 2 + ( y 1 y 2 ) 2 = ( x 1 2 + y 1 2 ) + ( x 2 2 + y 2 2 ) 2 | O A | | O B | cos θ

| O A | | O B | cos θ = x 1 x 2 + y 1 y 2

也就是向量点积

设两个向量 a = O A = ( x 1 , y 1 ) , b = O B = ( x 2 , y 2 ) ,向量夹角为 θ ,向量点积的如下:

a b = | a | | b | cos θ = x 1 x 2 + y 1 y 2

3 再看泰勒展开

一元的
lim Δ x 0 f ( x + Δ x ) f ( x ) Δ x = f ( x ) f ( x + Δ x ) = f ( x ) + f ( x ) Δ x + ο ( x )

二元的 与多元类似

(35) lim Δ x 0   Δ y 0 f ( x + Δ x , y + Δ y ) f ( x , y ) ( Δ x ) 2 + ( Δ y ) 2 = lim Δ x 0   Δ y 0 f ( x + Δ x , y + Δ y ) f ( x , y + Δ y ) + f ( x , y + Δ y ) f ( x , y ) ( Δ x ) 2 + ( Δ y ) 2 = lim Δ x 0   Δ y 0 f ( x ) Δ x ( Δ x ) 2 + ( Δ y ) 2 + f ( y ) Δ y ( Δ x ) 2 + ( Δ y ) 2 = f ( x ) c o s α + f ( y ) c o s β

梯度与单位方向向量的点积就是方向导数

a b = | a | × | b | × c o s ( a , b )

c o s ( a , b ) 在负梯度方向可得极小值

猜你喜欢

转载自blog.csdn.net/flyfish1986/article/details/79941057
今日推荐