方向导数
首先,我们先来讨论一下函数
y=f(x1,x2)在一点P沿某一方向的变化率问题。
假设函数
y=f(x1,x2)在点
P(x1,x2)的某一邻域
U(P)内有定义,自点P引射线
l。设
x轴正向到射线
l的转角为
φ,并设
P′(x1+Δx1,x2+Δx2)为
l上的另一点且
P′∈U(P)(如图)。
那么我们可以定义:
函数的增量
f(x1+Δx1,x2+Δx2)−f(x1,x2)与
PP′两点间的距离
ρ=(Δx1)2+(Δx2)2
的比值,当
P′沿着
l趋于
P时,如果这个比值的极限存在,则称这个极限为函数在点
P沿方向
l的方向导数。记为:
∂l∂f=ρ→0limρf(x1+Δx1,x2+Δx2)−f(x1,x2)
根据定义,函数
f(x1,x2)在点
P沿着
x1轴正向
e
1=1,0、
x2轴正向
e
2=0,1的方向导数分别为
fx1,
fx2;沿着
x轴负向、
y轴负向的方向导数是
−fx1,
−fx2。
如果函数
y=f(x1,x2)在点
P(x1,x2)在点
P(x1,x2)是可微分的,那么函数在该点沿任意方向
L的的方向导数都存在,且有
∂l∂f=∂x1∂fcosφ+∂x2∂fsinφ
其中
φ为
x轴到方向
L的转角。
那么推广到三元函数可得方向导数定义:
对于三元函数
y=f(x1,x2,x3),它在空间一点
P(x1,x2,x3)沿着方向
L的方向导数,可定义为:
∂l∂f=ρ→0limρf(x1+Δx1,x2+Δx2,x3+Δx3)−f(x1,x2,x3)
其中
ρ=(Δx1)2+(Δx2)2+(Δx3)2
同理:
设方向
L的方向角为
α,
β,
γ.
当函数在此点可微时,那么函数在该点沿任意方向
L的方向导数都存在,且有
∂l∂f=∂x1∂fcosα+∂x2∂fcosβ+∂x3∂fcosγ
注意:方向导数是一个值,是一个函数沿指定方向的变化率。
扫描二维码关注公众号,回复:
9127226 查看本文章
二元函数举例说明
假设有二元函数
y=f(x1,x2)如上图所示,横坐标代表
x1,纵坐标代表
x2,平面中的颜色代表不同的
y值。在Loss Function(损失函数)中可认为
x1,
x2分别代表两种不同的参数,而
y值代表Loss(损失)值。
现在我们在函数
y=f(x1,x2)中随机取一点(图中黄点表示)
P(x1,x2),很显然,P点不止一个方向,而是360°都有方向,并且每个方向都会有方向导数(即函数变化率)。
通俗地说,可以把这个图当作一个山脉地形图,图中的黄点代表山上有一个人,则方向导数就代表他走的方向的山的坡度大小。
梯度
我们现在已经知道,如果一个函数在某一点
P处可微,那么就可以确定这个函数在点
P的任一方向的方向导数。那么,函数在点
P沿哪一方向增加的速度最快呢?因此,就有了梯度这个概念。
设函数
y=f(x1,x2)在平面D内具有一阶连续偏导数,则对于每一点
P(x1,x2)∈D,都可定出一个向量
∂x1∂fi
+∂x2∂fj
,这向量称为函数
y=f(x1,x2)在点
P(x1,x2)的梯度,记为:
grad
f(x1,x2)=∂x1∂fi
+∂x2∂fj
注意:梯度是一个向量
那为什么说函数在该点处沿着梯度的方向变化最快呢?现在我们就来证明一下:
假设
e
=cosφi
+sinφj
是方向
l
上的单位向量,由方向导数公式可知:
∂l∂f=∂x1∂fcosφ+∂x2∂fsinφ =(∂x1∂f,∂x2∂f)⋅(cosφ,sinφ) =grad
f(x1,x2)⋅e
=∣grad
f(x1,x2)∣cos(grad
f(x1,x2),e
)
当
cos(grad
f(x1,x2),e
)=1时,方向导数
∂l∂f有最大值
∣grad
f(x1,x2)∣。此时,取得最大方向导数的方向就是梯度的方向。
因此,函数在某点的梯度是这样一个向量:它的方向与取得最大方向导数(即函数在该点变化速率最大)的方向一致,而它的模为方向导数的最大值,梯度的模为:
∣grad
f(x,y)∣=(∂x1∂f)2+(∂x2∂f)2
当然,梯度的概念也可以推广到三元函数(甚至更高维度)
三元函数
y=f(x1,x2,x3)在空间区域G内具有一阶连续偏导数,则对于每一点
P(x1,x2,x3)∈G,都可以定义一个向量(梯度):
grad
f(x1,x2,x3)=∂x1∂fi
+∂x2∂fj
+∂x3∂fk
类似于二元函数,此梯度也是一个向量,其方向与取得最大方向导数的方向一致,其模为方向导数的最大值。
二元函数举例说明
同样的图,假设有二元函数
y=f(x1,x2)如上图所示,横坐标代表
x1,纵坐标代表
x2,平面中的颜色代表不同的
y值。在Loss Function(损失函数)中可认为
x1,
x2分别代表两种不同的参数,而
y值代表Loss(损失)值。
现在我们在函数
y=f(x1,x2)中随机取一点(图中黄点表示)
P(x1,x2),很显然,P点不止一个方向,而是360°都有方向,并且每个方向都会有方向导数(即函数变化率),而梯度就指向方向导数最大的方向(等高线的法向量)。
通俗地说,可以把这个图当作一个喜马拉雅山地形图,图中的黄点代表有一个攀登者,他成功登顶并准备下山,方向导数就代表他所在地的坡度大小,现在他在海拔4500米的地方,如果他要以最快的速度下山,那么他就要往等高线的法向量(白线所指方向)也就是坡度最大的方向(即梯度方向)移动。
文章就到这里,还请大家帮忙勘误!