1. 泰勒级数展开
实际优化问题的目标函数往往比较复杂。为了使问题简化,通常将目标函数在某点附近展开为泰勒(Taylor)多项式来逼近原函数。
1.1 (一阶)偏导数的概念
以二元函数为例:
设有二元函数
z=f(x,y)
,若存在
ddxf(x,y0)|x=x0
则,称它为
z=f(x,y)
在点
(x0,y0)
处对
x
的
偏导数(值)。
记为:
f′x(x0,y0)
,
∂f(x0,y0)∂x
或
∂f∂x|(x0,y0)
【注】:可以看出偏导数的本质是 一元函数的导数
若
z=f(x,y)
在区域
D
的每一个点
(x,y)
处都有偏导数(值),一般来说,它们仍是
x,y
的函数,称为
f(x,y)
的偏导(函)数,简称偏导数
记为:
f′x(x,y)
或
∂f∂x
1.2 二阶偏导数与混合偏导数的概念
若函数
z=f(x,y)
的一阶偏导(函)数
∂f∂x=f′x,∂f∂y=f′y
关于
x
和
y
的偏导数仍然存在,
则,称一阶偏导数的偏导数是
z=f(x,y)
的二阶偏导数。
二元函数
z=f(x,y)
有四个二阶偏导数:
f′xx(x,y)
,
f′xy(x,y)
,
f′yx(x,y)
,
f′yy(x,y)
类似地可以定义三阶、四阶、n阶偏导数。
其中,对不同自变量求导的高阶偏导数称为混合偏导数。 如
f′xy(x,y)
,
f′yx(x,y)
1.3 函数的泰勒级数展开
一元函数
f(x)
在点
xk
处的泰勒展开式为:
f(x)=f(xk)+(x−xk)f′(xk)+12!(x−xk)2f′′(xk)+⋯+1n!(x−xk)nfn(xk)+o(n)
二元函数
f(x,y)
在点
(xk,yk)
处的泰勒展开式为:
f(x,y)=f(xk,yk)+(x−xk)f′x(xk,yk)+(y−yk)f′y(xk,yk)+12!(x−xk)2f′′xx(xk,yk)+12!(x−xk)(y−yk)f′′xy(xk,yk)+12!(y−yk)(x−xk)f′′yx(xk,yk)+12!(y−yk)2f′′yy(xk,yk)+⋯+o(n)
- n元函数
f(x1,x2,⋯,xn)
在点
(x1k,x2k,⋯,xnk)
处的泰勒展开为:
f(x1,x2,⋯,xn)=f(x1k,x2k,⋯,xnk)+∑i=1n(xi−xik)f′xi(x1k,x2k,⋯,xnk)+12!∑i,j=1n(xi−xik)(xj−xjk)f′xixj(x1k,x2k,⋯,xnk)+⋯+o(n)
该式可以表示为矩阵形式,如下:
2. 矩阵形式的泰勒级数展开式
记
X=[x1,x2,⋯,xn]T
,
Xk=[x1k,x2k,⋯,xnk]T
则,n元函数
f(X)
在点
Xk
处的泰勒展开为:
f(X)=f(Xk)+[∇f(Xk)]T(X−Xk)+12!(X−Xk)TH(Xk)(X−Xk)+o(n)
其中,
∇f(Xk)=[∂f(Xk)∂x1,∂f(Xk)∂x2,⋯,∂f(Xk)∂xn]T
称为n元函数
f(X)
在点
Xk
处的梯度(向量);
H(Xk)=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢∂2f(Xk)∂x1∂x1∂2f(Xk)∂x2∂x1⋮∂2f(Xk)∂xn∂x1∂2f(Xk)∂x1∂x2∂2f(Xk)∂x2∂x2⋮∂2f(Xk)∂xn∂x2⋯⋯⋱⋯∂2f(Xk)∂x1∂x3∂2f(Xk)∂x2∂x3⋮∂2f(Xk)∂xn∂x1⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥
2.1 雅各比矩阵
2.2 海森矩阵
2.3 变量为向量的泰勒级数展开