凸集、凸函数及其充分必要条件

凸集的定义:

设集合 D R n ,若对于任意点 x , y D 及实数 α [ 0 , 1 ] ,都有 α x + ( 1 α ) y D
则称集合 D 为凸集。
由凸集的定义可以看出凸集的几何意义,对于非空集合 D ,连接 D 中任意两点 x , y 的线段仍属于该集合,则该集合 D 是凸集。
图1所示的图形是凸集,图2显示的图形是非凸集。
这里写图片描述
这里写图片描述

凸函数定义:

设函数 f ( x ) 定义在凸集 D R n 上,若对于任意的 x , y D 及任意实数 α [ 0 , 1 ] ,都有 f [ α x + ( 1 α ) y ] α f ( x ) + ( 1 α ) f ( y ) ,则称 f ( x ) 为凸集 D 上的凸函数。

凸函数的充分必要条件:

(一阶条件)

设在凸集 D R n f ( x ) 可微,则 f ( x ) D 上为凸函数的充分必要条件是对任意的 x , y D 都有 f ( y ) f ( x ) + f ( x ) T ( y x )
证明:
必要性。 设 f ( x ) D 上的凸函数。任取 x , y D α [ 0 , 1 ] ,有

f [ α y + ( 1 α ) x ] α f ( y ) + ( 1 α ) f ( x )

f [ x + α ( y x ) ] f ( x ) + α [ f ( y ) f ( x ) ]

由泰勒公式有
f [ x + α ( y x ) ] = f ( x ) + α f ( x ) T ( y x ) + o ( α ( y x ) )

代入上式得

f ( y ) f ( x ) f ( x ) T ( y x ) + o ( α ( y x ) ) α

上式两端取极限,令 α 0

f ( y ) f ( x ) + f ( x ) T ( y x )

充分性。因为 D 为凸集,所以设任意的 x , y D α [ 0 , 1 ] ,则 α x + ( 1 α ) y D

α x + ( 1 α ) y = z ,有

f ( x ) f ( z ) f ( z ) T ( x z ) f ( y ) f ( z ) f ( z ) T ( y z )

α , 1 α 分别乘上面两式得

α [ f ( x ) f ( z ) ] α f ( z ) T ( x z ) ( 1 α ) [ f ( y ) f ( z ) ] ( 1 α ) f ( z ) T ( y z )

相加并整理得

α [ f ( x ) f ( z ) ] + ( 1 α ) [ f ( y ) f ( z ) ] α f ( z ) T ( x z ) + ( 1 α ) f ( z ) T ( y z ) α f ( x ) α f ( z ) + f ( y ) f ( z ) α f ( y ) + α f ( z ) f ( z ) T [ α x α z + y z α y + α z ] α f ( x ) + ( 1 α ) f ( y ) f ( z ) f ( z ) T [ α x + ( 1 α ) y z ] = 0 α f ( x ) + ( 1 α ) f ( y ) f ( z )

α f ( x ) + ( 1 α ) f ( y ) f [ α x + ( 1 α ) y ]
f ( x ) D 上是凸函数。

(二阶条件)

设在开凸集 D R n f ( x ) 二阶可微,则 f ( x ) D 内的凸函数的充分必要条件为在 D 内任意一点 x 处, f ( x ) 的海色(Hesse)矩阵 G ( x ) 半正定,其中

G ( x ) = 2 f ( x ) = [ 2 f x 1 2 2 f x 1 x 2 2 f x 1 x n 2 f x 2 x 1 2 f x 2 2 2 f x 2 x n 2 f x n x 1 2 f x n x 2 2 f x n 2 ]

证明:
必要性。任取 x D y R n ( y 0 ) ,因为 D 为开集,所以存在 ε > 0 ,当 α [ ε , ε ] 时, x + α y D ,由一阶条件可得

f ( x + α y ) f ( x ) + α f ( x ) T y

由泰勒公式有

f ( x + α y ) = f ( x ) + α f ( x ) T y + 1 2 α 2 y T G ( x ) y + o ( α 2 )

由此可得

1 2 α 2 y T G ( x ) y + o ( α 2 ) 0

所以

y T G ( x ) y + o ( α 2 ) α 2 0

α 0 ,取极限得

y T G ( x ) y 0

G ( x ) 半正定。

充分性。任取 x , y D ,因为 G ( x ) 半正定,由泰勒公式可得

f ( y ) = f ( x ) + f ( x ) T ( y x ) + 1 2 ( y x ) T G ( ξ ) ( y x ) f ( x ) + f ( x ) T ( y x )

其中 ξ = x + α ( y x ) , α ( 0 , 1 )
由一阶条件可得 f ( x ) 为凸函数。

猜你喜欢

转载自blog.csdn.net/qq_16000815/article/details/81154515