凸集、凸函数与凸规划

1. 凸集

S S n n 维欧式空间 R n \R^n 中的一个集合,若对 S S 中任意两点连线上的点仍属于 S S ,则称 S S 集为凸集,即
x ( 1 ) + λ [ x ( 2 ) x ( 1 ) ] S x^{(1)}+\lambda[x^{(2)}-x^{(1)}] \in S

2. 凸函数

f f 是定义在 S S 上的实函数,若连接函数 f f 曲线上任意两点的弦不在曲线下方,则称函数 f f S S 集上的凸函数,即
f ( x ( 1 ) + λ ( x ( 2 ) x ( 1 ) ) ) f ( x ( 1 ) ) + λ ( f ( x ( 2 ) ) f ( x ( 1 ) ) ) f(x^{(1)}+\lambda(x^{(2)} - x^{(1)}))\leq f(x^{(1)}) + \lambda(f(x^{(2)})-f(x^{(1)}))

证明: x 1 < x < x 2 x_1< x < x_2 0 < λ < 1 0 < \lambda <1, x = x 1 + λ ( x 2 x 1 ) x=x_1 + \lambda(x_2 - x_1) ,由定义可知函数 f f 曲线上任意两点的弦不在曲线下方(函数值较小),故
y y 1 y 2 y 1 = x x 1 x 2 x 1       f ( x 1 + λ ( x 2 x 1 ) ) f ( x 1 ) f ( x 2 ) f ( x 1 ) x 1 + λ ( x 2 x 1 ) x 2 x 1 \frac{y-y_1}{y_2-y_1}=\frac{x-x_1}{x_2-x_1} \implies \frac{f(x_1+\lambda(x_2-x_1))-f(x_1)}{f(x_2)-f(x_1)}\leq\frac{x_1+\lambda(x_2-x_1)}{x_2-x_1}

因此 f ( x 1 + λ ( x 2 x 1 ) ) f ( x 1 ) + λ ( f ( x 2 ) f ( x 1 ) ) f(x_1+\lambda(x_2-x_1)) \leq f(x_1)+\lambda(f(x_2)-f(x_1)) ,不等式得证。

2.1 凸函数一阶判别公式

f f 是定义在凸集 S S 上的可微函数,则 f ( x ) f(x) 为凸函数的充要条件是
f ( x ( 2 ) ) f ( x ( 1 ) ) + f ( x ( 1 ) ) T ( x ( 2 ) x ( 1 ) ) f(x^{(2)})\geq f(x^{(1)})+\nabla f(x^{(1)})^T(x^{(2)}-x^{(1)})

证明: 先证必要性,由 f ( x 1 + λ ( x 2 x 1 ) ) f ( x 1 ) + λ ( f ( x 2 ) f ( x 1 ) ) f(x_1+\lambda(x_2-x_1)) \leq f(x_1)+\lambda(f(x_2)-f(x_1)) ,得
f ( x 2 ) f ( x 1 ) + f ( x 1 + λ ( x 2 x 1 ) ) f ( x 1 ) λ ( x 2 x 1 ) ( x 2 x 1 ) f(x_2)\geq f(x_1)+\frac{f(x_1+\lambda(x_2-x_1))-f(x_1)}{\lambda (x_2-x_1)}(x_2-x_1)

显然当 λ 0 \lambda \to 0 时, f ( x 2 ) f ( x 1 ) + f ( x 1 ) ( x 2 x 1 ) f(x_2)\geq f(x_1)+f'(x_1)(x_2-x_1) ,必要性得证。
再证充分性,由 f ( x ) f ( y ) + f ( y ) ( x y ) f(x)\geq f(y)+f'(y)(x-y) ,因此
f ( x 1 ) f ( y ) + f ( y ) ( x 1 y ) , f ( x 2 ) f ( y ) + f ( y ) ( x 2 y ) f(x_1) \geq f(y)+f'(y)(x_1-y),\quad f(x_2) \geq f(y)+f'(y)(x_2-y)

因此令 y = x 1 + λ ( x 2 x 1 ) y=x_1+\lambda(x_2-x_1) ,上面左侧不等式两侧乘 ( 1 λ ) (1-\lambda) 、右侧不等式两侧乘 λ \lambda ,合并两个不等式得
( 1 λ ) f ( x 1 ) + λ f ( x 2 ) f ( y ) + f ( y ) [ x 1 + λ ( x 2 x 1 ) y ] = f ( y ) (1-\lambda)f(x_1)+\lambda f(x_2) \geq f(y) + f'(y)[x_1+\lambda(x_2-x_1) - y]=f(y)

显然 f ( x 1 + λ ( x 2 x 1 ) ) f ( x 1 ) + λ ( f ( x 2 ) f ( x 1 ) ) f(x_1+\lambda(x_2-x_1)) \leq f(x_1)+\lambda(f(x_2)-f(x_1)) ,充分性得证。

2.2 凸函数二阶判别公式

f f 是定义在凸集 S S 上的二阶可微函数,则 f ( x ) f(x) 为凸函数的充要条件是在任意 x x 处,Hesse矩阵半正定。

证明: 先证必要性,对任一点 x S \overline x \in S ,存在 λ [ 1 , 1 ] \lambda \in [-1, 1] ,有 x + λ x S \overline x + \lambda x \in S ,因此
f ( x + λ x ) f ( x ) + λ f ( x ) T x f(\overline x + \lambda x) \geq f(\overline x) + \lambda \nabla f(\overline x)^T x

f ( x ) f(x) 在点 x \overline x 处二次可微,则
f ( x + λ x ) = f ( x ) + λ f ( x ) T x + λ 2 2 x T 2 f ( x ) x + o ( λ x 2 ) f(\overline x + \lambda x)=f(\overline x) + \lambda\nabla f(\overline x)^Tx+\frac{\lambda^2}{2}x^T\nabla^2f(\overline x)x + o(||\lambda x||^2)


λ 2 2 x T 2 f ( x ) x + o ( λ x 2 ) 0       x T 2 f ( x ) x 0 \frac{\lambda^2}{2}x^T\nabla^2f(\overline x)x + o(||\lambda x||^2) \geq 0 \implies x^T\nabla^2f(\overline x)x \geq 0

再证充分性,设Hesse矩阵 2 f ( x ) \nabla^2f(x) 在每一点 x S x\in S 处半正定,对任意 x , x S \overline x, x\in S ,依中值定理得
f ( x ) = f ( x ) + f ( x ) T ( x x ) + 1 2 ( x x ) 2 2 f ( x ^ ) ( x x ) f(x) = f(\overline x) + \nabla f(\overline x)^T(x-\overline x)+\frac{1}{2}(x-\overline x)^2\nabla^2f(\hat x)(x-\overline x)

其中 x ^ = λ x + ( 1 λ ) x \hat x=\lambda\overline x + (1-\lambda)x S S 为凸集,因此当 x ^ S \hat x \in S 2 f ( x ^ ) \nabla^2f(\hat x) 半正定时,必有
( x x ) T 2 f ( x ^ ) ( x x ) 0 (x-\overline x)^T\nabla^2f(\hat x)(x-\overline x)\geq 0

f ( x ) f ( x ) + f ( x ) T ( x x ) f(x)\geq f(\overline x)+\nabla f(\overline x)^T(x-\overline x) ,充分性得证。

3. 凸规划

极小化问题 min x f ( x ) ; s . t . g i ( x ) 0 , h i ( x ) = 0 \min_x \quad f(x); \quad s.t. \quad g_i(x) \leq 0, \quad h_i(x)=0

上式 g i ( x ) g_i(x) 为凸函数,线性函数 h i ( x ) h_i(x) 既是凸函数又是凹函数。这类求凸函数在凸集上的极小点的问题,称为凸规划。

重要性质:凸规划的局部极小点就是全局极小点。
证明:由 f ( x ) = 0 \nabla f(\overline x)=0 ,显然 f ( x ) f ( x ) f(x)\geq f(\overline x) ,即 f ( x ) f(\overline x) 为全局极小点。

猜你喜欢

转载自blog.csdn.net/sinat_34072381/article/details/83685431