泰勒级数展开

1. 泰勒级数展开

实际优化问题的目标函数往往比较复杂。为了使问题简化,通常将目标函数在某点附近展开为泰勒(Taylor)多项式来逼近原函数。

1.1 (一阶)偏导数的概念

以二元函数为例:
设有二元函数 z = f ( x , y ) ,若存在

d d x f ( x , y 0 ) | x = x 0

则,称它为 z = f ( x , y ) 在点 ( x 0 , y 0 ) 处对 x 偏导数(值)
记为:
f x ( x 0 , y 0 ) f ( x 0 , y 0 ) x f x | ( x 0 , y 0 )


【注】:可以看出偏导数的本质是 一元函数的导数

z = f ( x , y ) 在区域 D 的每一个点 ( x , y ) 处都有偏导数(值),一般来说,它们仍是 x , y 的函数,称为 f ( x , y ) 偏导(函)数,简称偏导数
记为:
f x ( x , y ) f x


1.2 二阶偏导数与混合偏导数的概念

若函数 z = f ( x , y ) 的一阶偏导(函)数 f x = f x , f y = f y 关于 x y 的偏导数仍然存在,
则,称一阶偏导数的偏导数是 z = f ( x , y ) 的二阶偏导数。
二元函数 z = f ( x , y ) 有四个二阶偏导数:
f x x ( x , y ) f x y ( x , y ) f y x ( x , y ) f y y ( x , y )
类似地可以定义三阶、四阶、n阶偏导数。
其中,不同自变量求导的高阶偏导数称为混合偏导数。 f x y ( x , y ) f y x ( x , y )


1.3 函数的泰勒级数展开

  • 一元函数 f ( x ) 在点 x k 处的泰勒展开式为:

    f ( x ) = f ( x k ) + ( x x k ) f ( x k ) + 1 2 ! ( x x k ) 2 f ( x k ) + + 1 n ! ( x x k ) n f n ( x k ) + o ( n )

  • 二元函数 f ( x , y ) 在点 ( x k , y k ) 处的泰勒展开式为:

f ( x , y ) = f ( x k , y k ) + ( x x k ) f x ( x k , y k ) + ( y y k ) f y ( x k , y k ) + 1 2 ! ( x x k ) 2 f x x ( x k , y k ) + 1 2 ! ( x x k ) ( y y k ) f x y ( x k , y k ) + 1 2 ! ( y y k ) ( x x k ) f y x ( x k , y k ) + 1 2 ! ( y y k ) 2 f y y ( x k , y k ) + + o ( n )

  • n元函数 f ( x 1 , x 2 , , x n ) 在点 ( x k 1 , x k 2 , , x k n ) 处的泰勒展开为:
    f ( x 1 , x 2 , , x n ) = f ( x k 1 , x k 2 , , x k n ) + i = 1 n ( x i x k i ) f x i ( x k 1 , x k 2 , , x k n ) + 1 2 ! i , j = 1 n ( x i x k i ) ( x j x k j ) f x i x j ( x k 1 , x k 2 , , x k n ) + + o ( n )


    该式可以表示为矩阵形式,如下:

2. 矩阵形式的泰勒级数展开式

X = [ x 1 , x 2 , , x n ] T X k = [ x k 1 , x k 2 , , x k n ] T
则,n元函数 f ( X ) 在点 X k 处的泰勒展开为:

f ( X ) = f ( X k ) + [ f ( X k ) ] T ( X X k ) + 1 2 ! ( X X k ) T H ( X k ) ( X X k ) + o ( n )

其中, f ( X k ) = [ f ( X k ) x 1 , f ( X k ) x 2 , , f ( X k ) x n ] T
称为n元函数 f ( X ) 在点 X k 处的梯度(向量)

H ( X k ) = [ 2 f ( X k ) x 1 x 1 2 f ( X k ) x 1 x 2 2 f ( X k ) x 1 x 3 2 f ( X k ) x 2 x 1 2 f ( X k ) x 2 x 2 2 f ( X k ) x 2 x 3 2 f ( X k ) x n x 1 2 f ( X k ) x n x 2 2 f ( X k ) x n x 1 ]


2.1 雅各比矩阵

2.2 海森矩阵

2.3 变量为向量的泰勒级数展开

猜你喜欢

转载自blog.csdn.net/csdn_xcs/article/details/80966454