中科大-凸优化 笔记(lec11)-凸函数:二阶条件

全部笔记的汇总贴(视频也有传送门):中科大-凸优化

一、凸函数的定义(复习)

  1. f : R n → R f:\R^n\rightarrow\R f:RnR 为凸函数 ⇔ d o m f \Leftrightarrow dom f domf为凸集
    ∀ x , y ∈ d o m f , 0 ≤ θ ≤ 1 有 f ( θ x + ( 1 − θ ) y ) ≤ θ f ( x ) + ( 1 − θ ) f ( y ) \forall x,y\in dom f,0\le\theta\le1有f(\theta x+(1-\theta)y)\le\theta f(x)+(1-\theta)f(y) x,ydomf,0θ1f(θx+(1θ)y)θf(x)+(1θ)f(y)

  2. (高维情况) f : R n → R f:\R^n\rightarrow\R f:RnR为凸函数 ⇔ d o m f \Leftrightarrow dom f domf为凸集 ∀ x ∈ d o m f        ∀ 方 向 向 量 v g ( t ) = f ( x + t v ) 为 凸 函 数      d o m    g = { t ∣ x + t v ∈ d o m f } ( 降 维 ) \forall x\in dom f\;\;\;\forall 方向向量v\\g(t)=f(x+tv)为凸函数\;\;dom \;g=\{t|x+tv\in dom f\}(降维) xdomfvg(t)=f(x+tv)domg={ tx+tvdomf}

  3. f : R n → R f:\R^n\rightarrow\R f:RnR为凸函数 ⇔ d o m f \Leftrightarrow dom f domf为凸集
    f f f可微, ∀ x , y ∈ d o m f , f ( y ) ≥ f ( x ) + ∇ f T ( x ) ( y − x ) \forall x,y\in dom f,f(y)\ge f(x)+\nabla f^T(x)(y-x) x,ydomf,f(y)f(x)+fT(x)(yx)

(一维) f : R → R f:\R\rightarrow\R f:RR可微, f f f为等价于 d o m f dom f domf为凸, ∀ x , y ∈ d o m f , f ( y ) ≥ f ( x ) + f ( x ) ( y − x ) \forall x,y\in dom f,f(y)\ge f(x)+f(x)(y-x) x,ydomf,f(y)f(x)+f(x)(yx)

二、高维情况的证明

  • 证明( ⇒ \Rightarrow
    f f f为凸,考虑 x , y ∈ d o m f x,y\in dom f x,ydomf
    g ( t ) = f ( t y + ( 1 − t ) x ) = f ( x + t ( y − x ) ) g(t)=f(ty+(1-t)x)=f(x+t(y-x)) g(t)=f(ty+(1t)x)=f(x+t(yx))其中 t y + ( 1 − t ) x ty+(1-t)x ty+(1t)x看作仿射组合
    g ′ ( t ) = ∇ f T ( x + t ( y − x ) ) ( y − x ) g'(t)=\nabla f^T(x+t(y-x))(y-x) g(t)=fT(x+t(yx))(yx)
    g ( t 1 ) ≥ g ( t 2 ) + g ′ ( t 2 ) ( t 1 − t 2 ) g(t_1)\ge g(t_2)+g'(t_2)(t_1-t_2) g(t1)g(t2)+g(t2)(t1t2) ∀ t 1 , t 2 \forall t_1,t_2 t1,t2成立
    t 1 = 1 , t 2 = 0 t_1=1,t_2=0 t1=1,t2=0
    得到 g ( 1 ) ≥ g ( 0 ) + g ′ ( 0 ) f ( y ) ≥ f ( x ) + ∇ f T ( y − x ) g(1)\ge g(0)+g'(0)\\f(y)\ge f(x)+\nabla f^T(y-x) g(1)g(0)+g(0)f(y)f(x)+fT(yx)

  • 证明( ⇐ \Leftarrow
    ∀ x , y ∈ d o m f , ∀ t t y + ( 1 − t ) x ∈ d o m f t ~ y + ( 1 − t ~ ) x ∈ d o m f \forall x,y\in dom f,\forall t\\ty+(1-t)x\in dom f\\\tilde{t}y+(1-\tilde{t})x\in dom f x,ydomf,tty+(1t)xdomft~y+(1t~)xdomf
    f ( t y + ( 1 − t ) x ) ≥ f ( t ~ y + ( 1 − t ~ ) x ) + ∇ f T ( t ~ y + ( 1 − t ~ ) x ) ( t y + ( 1 − t ) x − t ~ y − ( 1 − t ~ ) x ) ≥ f ( t ~ y + ( 1 − t ~ ) x ) + ∇ f T ( t ~ y + ( 1 − t ~ ) x ) ( y − x ) ( t − t ~ ) f(ty+(1-t)x)\ge f(\tilde{t}y+(1-\tilde{t})x)+\nabla f^T(\tilde{t}y+(1-\tilde{t})x)(ty+(1-t)x-\tilde{t}y-(1-\tilde{t})x)\\\ge f(\tilde{t}y+(1-\tilde{t})x)+\nabla f^T(\tilde{t}y+(1-\tilde{t})x)(y-x)(t-\tilde{t}) f(ty+(1t)x)f(t~y+(1t~)x)+fT(t~y+(1t~)x)(ty+(1t)xt~y(1t~)x)f(t~y+(1t~)x)+fT(t~y+(1t~)x)(yx)(tt~)

又已知 g ( t ) = f ( t y + ( 1 − t ) x ) g ( t ~ ) = f ( t ~ y + ( 1 − t ~ ) x ) g ′ ( t ~ ) = ∇ f T ( t ~ y + ( 1 − t ~ ) x ) ( y − x ) g(t)=f(ty+(1-t)x)\\g(\tilde{t})=f(\tilde{t}y+(1-\tilde{t})x)\\g'(\tilde t)=\nabla f^T(\tilde{t}y+(1-\tilde{t})x)(y-x) g(t)=f(ty+(1t)x)g(t~)=f(t~y+(1t~)x)g(t~)=fT(t~y+(1t~)x)(yx)

所以 g ( t ) ≥ g ( t ~ ) + g ′ ( t ) ( t − t ~ )                  f ( x ) 是 凸 函 数 g(t)\ge g(\tilde t)+g'(t)(t-\tilde t)\;\;\;\;\;\;\;\;f(x)是凸函数 g(t)g(t~)+g(t)(tt~)f(x)

三、二阶条件

f : R n → R f:\R^n\rightarrow\R f:RnR二阶可微,则 f f f为凸函数
⇔ d o m f \Leftrightarrow dom f domf为凸集, ∇ 2 f ( x ) ⪰ 0 , ∀ x ∈ d o m f \nabla^2 f(x)\succeq0,\forall x\in dom f 2f(x)0,xdomf,其中 ∇ 2 f ( x ) \nabla^2 f(x) 2f(x)为Hessian矩阵

∇ 2 f ( x ) ≻ 0 ⇒ 严 格 凸 函 数          ⇐    × \nabla^2 f(x)\succ0\Rightarrow 严格凸函数\;\;\;\;\Leftarrow\;× 2f(x)0×

f ( x ) = x 4 f ′ ′ ( x ) = 12 x 2 f ′ ′ ( 0 ) = 0 f(x)=x^4\\f''(x)=12x^2\\f''(0)=0 f(x)=x4f(x)=12x2f(0)=0
是严格凸函数,但是 f ′ ′ ( 0 ) = 0 f''(0)=0 f(0)=0

下一章传送门:中科大-凸优化 笔记(lec12)-一些常见的凸函数

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/113703738