让我首先讨论一下形式的约束规划问题：

min f (x), s. t. x \in R n c i (x) = 0, i \in E = {1, 2, \dots, l} c i (x) \leq 0, i \in I = {l + 1, l + 2, \dots, l + m}

$\begin{split}&\min f(x),&\quad x\in \mathbb{R}^{n} \\ &\text{s. t. }&c_{i}(x)=0,\quad i\in E=\{1,2,\dots, l\}\\ & &c_{i}(x)\leq 0, \quad i\in I=\{l+1,l+2,\dots, l+m\} \end{split}$

本文中我们不深究一般约束规划问题的最优性性条件的证明，仅给出部分常用定理。后续我们也仅针对凸优化问题做详细讨论。

基本概念
局部解的必要条件
- 一阶必要条件
- 约束限制条件成立的充分条件
二阶充分条件
凸优化问题
二次规划问题
求解二次规划问题
- 等式约束二次规划问题的条件
- 有效集法

基本概念

无约束规划问题的讨论详见此文，这里介绍了局部解与全局解得概念。约束规划问题解得概念与之类似，此处省略。但要注意这里存在可行域的问题。记上述约束规划问题的可行域为：

D = {x | c i (x) = 0, i \in E, c i (x) \leq 0, i \in I}

$D=\{x | c_{i}(x)=0, i\in E, c_{i}(x)\leq 0, i\in I \}$

设 $\hat{x}$ 是一般约束问题的可行点，当 $i\in I$ 时，对某个约束，若 $c_{i}(\hat{x})=0$ ，则称 $c_{i}(\hat{x})\leq 0$ 为 $\hat{x}$ 处的有效约束（active constraint）；若 $c_{i}(\hat{x})<0$ ，则称 $c_{i}(\hat{x})\leq 0$ 为 $\hat{x}$ 处的非有效约束。定义

I(x^)={i|ci(x^)=0,i∈I}

$I(\hat{x})=\{i | c_{i}(\hat{x})=0, i\in I\}$ 为

x^ $\hat{x}$ 处的 有效集（active set）。

局部解的必要条件

一阶必要条件

考虑上述约束规划问题，这里我们假设 $f(x), c_{i}(x), (i=1,2,\dots,l+m)$ 是连续可微函数。由于时间有限，这里对可行点（feasible point）、可行方向（feasible direction）、线性化锥、约束限制条件（constraint qualification）、Farkas引理 等概念、定理不作介绍。我们引进Lagrange函数：

L (x, λ) = f (x) + \sum i = 1 l + m λ i c i (x)

$L(x,\lambda)=f(x)+\sum_{i=1}^{l+m}\lambda_{i}c_{i}(x)$ 定理 1（约束问题局部解的一阶必要条件）：
设约束问题中

f(x),ci(x),(i=1,2,…,l+m) $f(x), c_{i}(x), (i=1,2,\dots,l+m)$ 具有连续可微的一阶偏导数，若

x∗ $x^{*}$ 是该约束问题的局部解，并且在

x∗ $x^{*}$ 处约束限制条件成立 1，则存在

λ∗=(λ∗1,λ∗2,…,λ∗l+m)T $\lambda^{*}=(\lambda_{1}^{*}, \lambda_{2}^{*},\dots, \lambda_{l+m}^{*})^{T}$ 使得：

\nabla x L (x *, λ *) = \nabla f (x *) + \sum i = 1 l + m λ * i \nabla c i (x *) = 0

$\nabla_{x}L(x^{*}, \lambda^{*})=\nabla f(x^{*})+\sum_{i=1}^{l+m}\lambda_{i}^{*}\nabla c_{i}(x^{*})=0$ 其中

c i (x *) = 0, i \in E = {1, 2, \dots, l} c i (x *) \leq 0, i \in I = {l + 1, l + 2, \dots, l + m} λ * i \geq 0, i \in I = {l + 1, l + 2, \dots, l + m} λ * i c i (x *) = 0, i \in I = {l + 1, l + 2, \dots, l + m}

$\begin{gather} c_{i}(x^{*})=0, i\in E=\{1,2,\dots,l\} \\ c_{i}(x^{*})\leq 0, i\in I=\{l+1,l+2,\dots,l+m\} \\ \lambda_{i}^{*}\geq 0, i\in I=\{l+1,l+2,\dots,l+m\} \\ \lambda_{i}^{*}c_{i}(x^{*})=0, i\in I=\{l+1,l+2,\dots,l+m\} \end{gather}$ 上述一阶必要条件被称为 Kuhn-Tucker条件，或简称K-T条件；满足上式的点为 K-T点；称

λ∗ $\lambda^{*}$ 为

x∗ $x^{*}$ 处的 Lagrange乘子（Lagrange Multiplier）。

约束限制条件成立的充分条件

定理 2：
若在前述约束优化问题的局部解 $x^{*}$ 处下述两条件之一成立：

$c_{i}(x), i\in E\cup I(x^{*})$ 是线性函数；
$\nabla c_{i}(x^{*}), i\in E\cup I(x^{*})$ 线性无关；

则在 $x^{*}$ 处约束限制条件成立。此时必存在 $\lambda^{*}$ 使得 K-T 条件成立。

二阶充分条件

这里给出一般约束问题的二阶充分条件，不作证明。
定理 3:（约束问题的二阶充分条件）
考虑上述约束问题，设 $f(x), c_{i}(x), (i\in E\cup I)$ 具有连续的二阶偏导数，若存在 $x^{*}$ 满足下列条件：

K-T条件成立（参考定理 1），且 $\lambda_{i}^{*}$ 和 $c_{i}(x^{*}) (i\in I)$ 不同时为0 （严格松弛互补条件）；
对于任意的 $d\in M$ 有 $d T \nabla 2 x L (x *, λ *) d > 0$ $d^{T}\nabla_{x}^{2}L(x^{*}, \lambda^{*})d>0$ 其中 $M=\{d\in \mathbb{R}^{n} | d\neq 0, \nabla c_{i}(x^{*})^{T}d=0, i\in E\cup I(x^{*})\}$ .

则 $x^{*}$ 是约束问题的严格局部解。

凸优化问题

对于一般的非线性规划，若目标函数是凸函数，约束集合 $D$ 是凸集，则称改非线性规划是凸规划。显然，若上述约束规划中只含有不等式约束，又 $c_{i}(x) (i\in I)$ 是凸函数，则约束集 $D$ 是凸集。对于混合约束问题，若 $c_{i}(x) (i\in E)$ 是线性函数， $c_{i}(x) (i\in I)$ 是凸函数，则 $D$ 是凸集。

定理 4：凸规划的局部解必是全局解。

定理 5 ：设目标函数 $f(x)$ 和约束函数 $c_{i}(x)$ 一阶连续可微，并且 $c_{i}(x) (i\in E)$ 是线性函数， $c_{i}(x) (i\in I)$ 是凸函数。若凸规划的可行点 $x^{*}$ 是K-T点，则 $x^{*}$ 必是全局解。

二次规划问题

一般的约束规划问题求解非常困难，从下面开始我们将仅讨论凸二次规划问题的求解方法。考虑如下约束优化问题：

min s. t. {f (x) = 1 2 x T G x + r T x}, x \in R n c i (x) = α T i x - b i = 0, i \in E = {1, 2, \dots, l} c i (x) = α T i x - b i \leq 0, i \in I = {l + 1, l + 2, \dots, l + m}

$\begin{split} &\min &\left\{f(x)=\frac{1}{2}x^{T}Gx+r^{T}x\right\}, x\in\mathbb{R}^{n}\\ &\text{s. t. }&c_{i}(x)=\alpha_{i}^{T}x-b_{i}=0, i\in E=\{1,2,\dots, l\}\\ & &c_{i}(x)=\alpha_{i}^{T}x-b_{i}\leq 0, i\in I=\{l+1,l+2,\dots, l+m\} \end{split}$ 其中

G $G$ 为

n×n $n\times n$ 对称矩阵，

r,αi(i∈E∪I) $r, \alpha_{i} (i\in E\cup I)$ 为

n $n$ 维实向量，

bi(i∈E∪I) $b_{i} (i\in E \cup I)$ 为实数，称上述问题为 二次规划（quadratic programming）问题，过

G $G$ 为（正定）半正定矩阵，则称上述问题为（严格） 凸二次规划（convex quadratic programming）。

下面讨论凸二次规划问题解得条件：
定理 6： $x^{*}$ 是上述凸二次规划问题的全局最优解得充分必要条件是： $x^{*}$ 是K-T点，即存在 $\lambda^{*}= (\lambda_{1}^{*}, \lambda_{2}^{*},\dots,\lambda_{l+m}^{*})$ 使得：

G x * + r + \sum i = 1 l + m λ * i α i = 0 α T i x * - b i = 0, i \in E α T i x * - b i \leq 0, i \in I λ * i \geq 0, i \in I λ * i (α T i x * - b i) = 0, i \in I

$\begin{gather} Gx^{*}+r+\sum_{i=1}^{l+m}\lambda_{i}^{*}\alpha_{i}=0 \\ \alpha_{i}^{T}x^{*}-b_{i}=0, i\in E\\ \alpha_{i}^{T}x^{*}-b_{i}\leq 0, i\in I\\ \lambda_{i}^{*}\geq 0, i\in I\\ \lambda_{i}^{*}(\alpha_{i}^{T}x^{*}-b_{i})=0, i\in I \end{gather}$ （严格）凸二次规划问题的局部解均是全局最优解。

定理 7：若 $x^{*}$ 是上述凸二次规划的全局最优解，则 $x^{*}$ 是如下等式约束二次规划问题

min {f (x) = 1 2 x T G x + r T x}, x \in R n s. t. c i (x) = α T i x - b i = 0, i \in E \cup I (x *)

$\begin{split} &\min\left\{f(x)=\frac{1}{2}x^{T}Gx+r^{T}x\right\}, x\in\mathbb{R}^{n} \\ &\text{s. t. }c_{i}(x)=\alpha_{i}^{T}x-b_{i}=0, i\in E\cup I(x^{*}) \end{split}$ 的全局最优解。

求解二次规划问题

等式约束二次规划问题的条件

本节讨论如下只有等式约束的二次规划问题：

min {f (x) = 1 2 x T G x + r T x} s. t. A x = b

$\begin{split} &\min\left\{f(x)=\frac{1}{2}x^{T}Gx+r^{T}x\right\} \\ &\text{s. t. } Ax=b \end{split}$ 的求解方法，其中

A=(α1,α2,…,αn) $A=(\alpha_{1}, \alpha_{2}, \dots, \alpha_{n})$ ,

αi,b=(b1,b2,…,bm)T $\alpha_{i}, b=(b_{1}, b_{2}, \dots, b_{m})^{T}$ 是

m $m$ 维列向量且

rank(A)=m $\mathrm{rank}(A)=m$ ，即矩阵是行满秩的。当上述问题中矩阵

G $G$ 为正定或半正定矩阵时，此极值问题可以转换成解线性方程组的问题。

定理 8：
当上述问题中的矩阵 $G$ 是半正定（正定）矩阵时，局部解 $x^{*}$ 是全局最优解，这是 $\lambda^{*}$ 为相应的乘子的充分必要条件是： $x^{*},\lambda^{*}$ 是线性方程组

(G A A T O) (x λ) = (- r b)

$\begin{pmatrix}G & A^{T} \\ A & O \end{pmatrix} \begin{pmatrix}x \\ \lambda \end{pmatrix} = \begin{pmatrix} -r \\ b \end{pmatrix}$ 该定理的证明只需要考虑Lagrange函数：

L(x,λ)=12xTGx+rTx+λT(Ax−b) $L(x,\lambda)=\frac{1}{2}x^{T}Gx+r^{T}x+\lambda^{T}(Ax-b)$ 。

有效集法

有效集法，顾名思义，就是通过求解有限个等式约束二次规划问题来得到一般约束二次规划问题的解。时间问题，这里我们不对有效集算法的一般原理进行阐述，仅介绍其算法步骤。

对于上述一般凸二级规划问题：

取初始可行点 $x^{1}$ ，即 $x^{1}$ 满足： $α T i x 1 - b i = 0, i \in E, α T i x 1 - b i \leq 0, i \in I$ $\alpha_{i}^{T}x^{1}-b_{i}=0, i\in E,\quad \alpha_{i}^{T}x^{1}-b_{i}\leq 0, i\in I$ 确定 $x^{1}$ 处的有效约束指标集 $I (x 1) = {i | α T i x 1 - b i = 0, i \in I}$ $I(x^{1})=\{i | \alpha_{i}^{T}x^{1}-b_{i}=0, i\in I \}$ 置 $k=1$ 。
求解等式二次规划问题 $min 1 2 d T G d + \nabla f (x k) T d s. t. α T i d = 0, i \in E \cup I (x k)$ $\begin{split} &\min \frac{1}{2}d^{T}Gd+\nabla f(x^{k})^{T}d \\ & \text{s. t. } \alpha_{i}^{T}d=0, i\in E\cup I(x^{k}) \end{split}$ 得到 $d^{k}$ 。
若 $d^{k}=0$ , 则计算相应的乘子 $\lambda^{k}$ 。若 $\lambda_{i}^{k}\geq 0, \forall i\in I(x^{k})$ 则停止计算（ $x^{k}$ 为一般二次规划的解， $\lambda^{k}$ 为相应的乘子）；否则求： $λ k q = min {λ k i | i \in I (x k)}$ $\lambda_{q}^{k}=\min\{\lambda_{i}^{k} | i\in I(x^{k})\}$ 并置 $x^{k+1}=x^{k}$ , $I(x^{k+1})=I(x^{k})-\{q\}$ , $k:=k+1$ ，转至步骤2。
若 $d^{k}\neq 0$ 则计算 $α^k=min{bi−αTixkαTidk∣∣∣αTidk>0,i∉I(xk)}=bp−αTpxkαTpdk$ $\hat{\alpha}_{k}= \min\left\{\left.\frac{b_{i}-\alpha_{i}^{T}x^{k}}{\alpha_{i}^{T}d^{k}} \right| \alpha_{i}^{T}d^{k}>0, i\notin I(x^{k}) \right\} = \frac{b_{p}-\alpha_{p}^{T}x^{k}}{\alpha_{p}^{T}d^{k}}$ 取 $\alpha_{k}=\min\{\hat{\alpha}_{k}, 1\}$ ，置 $x^{k+1}=x^{k}+\alpha_{k}d^{k}$ 。如果 $\alpha_{k}=\hat{\alpha}_{k}$ ，则置 $I(x^{k+1})=I(x^{k})+\{p\}$ ；否则置 $I(x^{k+1})=I(x^{k})$ ，置 $k:=k+1$ ，转至步骤2。

通常称任何一个保证 $LD^{*}=FD^{*}$ 成立的条件为约束限制条件。其中 $LD^{*}\cup\{0\}$ 为线性化锥， $FD^{*}$ 为 $x^{*}$ 处的全体可行方向的集合。 ↩

约束规划问题与凸二次规划