Young’s inequality
a b ≤ a p p + b q q ab \le \frac{a^p}{p} + \frac{b^q}{q} ab≤pap+qbq
其中 a ≥ 0 , b ≥ 0 , p > 1 , q > 1 , 1 p + 1 q = 1 a\ge0,b\ge0,p>1,q>1,\frac{1}{p}+\frac{1}{q}=1 a≥0,b≥0,p>1,q>1,p1+q1=1
当且仅当 a p = b q a^p=b^q ap=bq时取等
证明:
当 a = 0 a=0 a=0或 b = 0 b=0 b=0时显然成立
当 a > 0 , b > 0 a>0,b>0 a>0,b>0时
由Jensen不等式
ln ( a p p + b q q ) ≥ 1 p ln a p + 1 q ln b q = ln a b \begin{aligned} \ln\left( \frac{a^p}{p} + \frac{b^q}{q}\right)\ge \frac{1}{p}\ln a^p + \frac{1}{q}\ln b^q=\ln ab \end{aligned} ln(pap+qbq)≥p1lnap+q1lnbq=lnab
当且仅当 a p = b q a^p=b^q ap=bq时取等
Hölder’s inequality
∑ i = 1 n ∣ x i y i ∣ ≤ ∥ x ∥ p ∥ y ∥ q \sum_{i=1}^{n}\left|x_iy_i\right|\le \|\mathbf{x}\|_p \|\mathbf{y}\|_q i=1∑n∣xiyi∣≤∥x∥p∥y∥q
其中 p ≥ 1 , q ≥ 1 , 1 p + 1 q = 1 p\ge 1, q\ge 1,\frac{1}{p}+\frac{1}{q}=1 p≥1,q≥1,p1+q1=1
∥ x ∥ p = ( ∑ i = 1 n ∣ x i ∣ p ) 1 p \|\mathbf{x}\|_p=\left(\sum_{i=1}^{n}\left|x_i\right|^p\right)^{\frac{1}{p}} ∥x∥p=(∑i=1n∣xi∣p)p1
当且仅当 x = 0 \mathbf{x}=\mathbf{0} x=0或 y = 0 \mathbf{y}=\mathbf{0} y=0,或 ∃ c 1 , c 2 > 0 \exists c1,c2>0 ∃c1,c2>0,使得 c 1 ∣ x i ∣ p = c 2 ∣ y i ∣ q c_1\left|x_i\right|^p=c_2\left|y_i\right|^q c1∣xi∣p=c2∣yi∣q
证明:
当 x = 0 \mathbf{x}=\mathbf{0} x=0或 y = 0 \mathbf{y}=\mathbf{0} y=0时显然成立
当 x ≠ 0 , y ≠ 0 \mathbf{x}\neq \mathbf{0},\mathbf{y}\neq \mathbf{0} x=0,y=0时
当 p = 1 p=1 p=1时
∑ i = 1 n ∣ x i y i ∣ ≤ ( max i ∣ y i ∣ ) ∑ i = 1 n ∣ x i ∣ = ∥ x ∥ 1 ∥ y ∥ ∞ \sum_{i=1}^{n} \left|x_iy_i\right|\le \left(\max_i \left|y_i\right|\right)\sum_{i=1}^{n}\left|x_i\right|=\|\mathbf{x}\|_1\|\mathbf{y}\|_\infty ∑i=1n∣xiyi∣≤(maxi∣yi∣)∑i=1n∣xi∣=∥x∥1∥y∥∞
同理 q = 1 q=1 q=1
当 p > 1 p>1 p>1时
设 A i = ∣ x i ∣ ∥ x ∥ p , B i = ∣ y i ∣ ∥ y ∥ q A_i = \frac{\left|x_i\right|}{\|\mathbf{x}\|_p}, B_i = \frac{\left|y_i\right|}{\|\mathbf{y}\|_q} Ai=∥x∥p∣xi∣,Bi=∥y∥q∣yi∣
由Young不等式
A i B i = ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p ∣ x i ∣ p ∥ x ∥ p p + 1 q ∣ y i ∣ q ∥ y ∥ q q A_iB_i = \frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q}\le \frac{1}{p}\frac{\left|x_i\right|^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{\left|y_i\right|^q}{\|\mathbf{y}\|_q^q} AiBi=∥x∥p∥y∥q∣xiyi∣≤p1∥x∥pp∣xi∣p+q1∥y∥qq∣yi∣q
两边求和
∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ ∑ i = 1 n 1 p ∣ x i ∣ p ∥ x ∥ p p + 1 q ∣ y i ∣ q ∥ y ∥ q q ∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p ∑ i = 1 n ∣ x i ∣ p ∥ x ∥ p p + 1 q ∑ i = 1 n ∣ y i ∣ q ∥ y ∥ q q ∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p ∥ x ∥ p p ∥ x ∥ p p + 1 q ∥ y ∥ q q ∥ y ∥ q q ∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p + 1 q ∑ i = 1 n ∣ x i y i ∣ ≤ ∥ x ∥ p ∥ y ∥ q \begin{aligned} \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le \sum_{i=1}^{n}\frac{1}{p}\frac{\left|x_i\right|^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{\left|y_i\right|^q}{\|\mathbf{y}\|_q^q}\\ \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le\frac{1}{p}\frac{ \sum_{i=1}^{n}\left|x_i\right|^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{ \sum_{i=1}^{n}\left|y_i\right|^q}{\|\mathbf{y}\|_q^q}\\ \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le\frac{1}{p}\frac{ \|\mathbf{x}\|_p^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{ \|\mathbf{y}\|_q^q}{\|\mathbf{y}\|_q^q}\\ \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le\frac{1}{p}+\frac{1}{q}\\ \sum_{i=1}^{n}\left|x_iy_i\right| &\le \|\mathbf{x}\|_p \|\mathbf{y}\|_q \end{aligned} i=1∑n∥x∥p∥y∥q∣xiyi∣i=1∑n∥x∥p∥y∥q∣xiyi∣i=1∑n∥x∥p∥y∥q∣xiyi∣i=1∑n∥x∥p∥y∥q∣xiyi∣i=1∑n∣xiyi∣≤i=1∑np1∥x∥pp∣xi∣p+q1∥y∥qq∣yi∣q≤p1∥x∥pp∑i=1n∣xi∣p+q1∥y∥qq∑i=1n∣yi∣q≤p1∥x∥pp∥x∥pp+q1∥y∥qq∥y∥qq≤p1+q1≤∥x∥p∥y∥q
c 1 ∣ x i ∣ p = c 2 ∣ y i ∣ q c 1 ∑ i = 1 n ∣ x i ∣ p = c 2 ∑ i = 1 n ∣ y i ∣ q c 1 c 2 = ∥ y ∥ q q ∥ x ∥ p p \begin{aligned} c_1\left|x_i\right|^p &=c_2\left|y_i\right|^q\\ c_1\sum_{i=1}^{n}\left|x_i\right|^p &= c_2\sum_{i=1}^{n}\left|y_i\right|^q\\ \frac{c_1}{c_2} &=\frac{\|\mathbf{y}\|_q^q}{\|\mathbf{x}\|_p^p} \end{aligned} c1∣xi∣pc1i=1∑n∣xi∣pc2c1=c2∣yi∣q=c2i=1∑n∣yi∣q=∥x∥pp∥y∥qq
c 1 ∣ x i ∣ p = c 2 ∣ y i ∣ q ∣ y i ∣ = c 1 c 2 ∣ x i ∣ p q ∣ y i ∣ = ∥ y ∥ q ∥ x ∥ p p − 1 ∣ x i ∣ p − 1 ∣ x i y i ∣ = ∥ y ∥ q ∥ x ∥ p p − 1 ∣ x i ∣ p ∑ i = 1 n ∣ x i y i ∣ = ∑ i = 1 n ∥ y ∥ q ∥ x ∥ p p − 1 ∣ x i ∣ p ∑ i = 1 n ∣ x i y i ∣ = ∥ x ∥ p ∥ y ∥ q \begin{aligned} c_1\left|x_i\right|^p &=c_2\left|y_i\right|^q\\ \left|y_i\right| &= \sqrt[q]{\frac{c_1}{c_2}\left|x_i\right|^p}\\ \left|y_i\right| &= \frac{\|\mathbf{y}\|_q}{\|\mathbf{x}\|_p^{p-1}}\left|x_i\right|^{p-1}\\ \left|x_iy_i\right| &= \frac{\|\mathbf{y}\|_q}{\|\mathbf{x}\|_p^{p-1}}\left|x_i\right|^{p}\\ \sum_{i=1}^{n}\left|x_iy_i\right| &= \sum_{i=1}^{n}\frac{\|\mathbf{y}\|_q}{\|\mathbf{x}\|_p^{p-1}}\left|x_i\right|^{p}\\ \sum_{i=1}^{n}\left|x_iy_i\right| &= \|\mathbf{x}\|_p \|\mathbf{y}\|_q\\ \end{aligned} c1∣xi∣p∣yi∣∣yi∣∣xiyi∣i=1∑n∣xiyi∣i=1∑n∣xiyi∣=c2∣yi∣q=qc2c1∣xi∣p=∥x∥pp−1∥y∥q∣xi∣p−1=∥x∥pp−1∥y∥q∣xi∣p=i=1∑n∥x∥pp−1∥y∥q∣xi∣p=∥x∥p∥y∥q
dual norm of p norm
设 ∥ ⋅ ∥ \|\cdot \| ∥⋅∥是定义在 R n \mathbb{R}^n Rn的范数
对偶范数 ∥ ⋅ ∥ ∗ \|\cdot \|_* ∥⋅∥∗定义为
∥ z ∥ ∗ = sup ∥ x ∥ ≤ 1 z T x \|\mathbf{z}\|_*=\sup\limits_{\|x\|\le 1} \mathbf{z}^T\mathbf{x} ∥z∥∗=∥x∥≤1supzTx
也可以推出 x T z ≤ ∥ x ∥ ∥ z ∥ ∗ \mathbf{x}^T\mathbf{z}\le \|\mathbf{x}\|\|\mathbf{z}\|_* xTz≤∥x∥∥z∥∗
p norm
∥ z ∥ q = sup ∥ x ∥ p ≤ 1 z T x \|\mathbf{z}\|_q=\sup\limits_{\|x\|_p\le 1} \mathbf{z}^T\mathbf{x} ∥z∥q=∥x∥p≤1supzTx
其中 p ≥ 1 , q ≥ 1 , 1 p + 1 q = 1 p\ge 1, q\ge 1, \frac{1}{p}+\frac{1}{q}=1 p≥1,q≥1,p1+q1=1
证明:
当 z = 0 \mathbf{z}=\mathbf{0} z=0时,显然成立
当 z ≠ 0 \mathbf{z}\neq \mathbf{0} z=0时
由Holder不等式
z T x ≤ ∑ i = 1 n ∣ z i ∣ ∣ x i ∣ ≤ ∥ x ∥ p ∥ z ∥ q ≤ ∥ z ∥ q \begin{aligned} \mathbf{z}^T\mathbf{x} \le \sum_{i=1}^{n}\left|z_i\right|\left|x_i\right|\le\|\mathbf{x}\|_p\|\mathbf{z}\|_q \le \|\mathbf{z}\|_q \end{aligned} zTx≤i=1∑n∣zi∣∣xi∣≤∥x∥p∥z∥q≤∥z∥q
下面验证一下取等
令 x i = sign ( z i ) ∣ z i ∣ q − 1 ∥ z ∥ q q p x_i=\frac{\operatorname{sign}\left(z_i\right)\left|z_i\right|^{q-1}}{\|\mathbf{z}\|_q^{\frac{q}{p}}} xi=∥z∥qpqsign(zi)∣zi∣q−1
∥ x ∥ p p = ∑ i = 1 n ∣ sign ( z i ) ∣ z i ∣ q − 1 ∥ z ∥ q q p ∣ p = ∑ i = 1 n ∣ z i ∣ p q − p ∥ z ∥ q q = ∑ i = 1 n ∣ z i ∣ q ∥ z ∥ q q = ∥ z ∥ q q ∥ z ∥ q q = 1 \begin{aligned} \|\mathbf{x}\|_p^p&=\sum_{i=1}^n\left|\frac{\operatorname{sign}\left(z_i\right)\left|z_i\right|^{q-1}}{\|\mathbf{z}\|_q^{\frac{q}{p}}}\right|^p\\ &=\sum_{i=1}^n\frac{\left|z_i\right|^{pq-p}}{\|\mathbf{z}\|_q^q}\\ &=\sum_{i=1}^n\frac{\left|z_i\right|^{q}}{\|\mathbf{z}\|_q^q}\\ &=\frac{\|\mathbf{z}\|_q^q}{\|\mathbf{z}\|_q^q}\\ &=1\\ \end{aligned} ∥x∥pp=i=1∑n
∥z∥qpqsign(zi)∣zi∣q−1
p=i=1∑n∥z∥qq∣zi∣pq−p=i=1∑n∥z∥qq∣zi∣q=∥z∥qq∥z∥qq=1
于是
∥ x ∥ p ≤ 1 \|\mathbf{x}\|_p\le 1 ∥x∥p≤1
因此
z T x = ∑ i = 1 n sign ( z i ) ∣ z i ∣ q − 1 ∥ z ∥ q q p z i = ∑ i = 1 n ∣ z i ∣ q ∥ z ∥ q q p = ∥ z ∥ q q ∥ z ∥ q q p = ∥ z ∥ q \begin{aligned} \mathbf{z}^T\mathbf{x} &=\sum_{i=1}^{n}\frac{\operatorname{sign}\left(z_i\right)\left|z_i\right|^{q-1}}{\|\mathbf{z}\|_q^{\frac{q}{p}}}z_i\\ &=\sum_{i=1}^{n}\frac{\left|z_i\right|^{q}}{\|\mathbf{z}\|_q^{\frac{q}{p}}}\\ &=\frac{\|\mathbf{z}\|_q^q}{\|\mathbf{z}\|_q^{\frac{q}{p}}}\\ &=\|\mathbf{z}\|_q \end{aligned} zTx=i=1∑n∥z∥qpqsign(zi)∣zi∣q−1zi=i=1∑n∥z∥qpq∣zi∣q=∥z∥qpq∥z∥qq=∥z∥q
conjugate
f : R n → R f:\mathbb{R}^n\to \mathbb{R} f:Rn→R
共轭函数
f ∗ ( y ) = max x y T x − f ( x ) f^*\left(\mathbf{y}\right) = \max_{\mathbf{x}}\mathbf{y}^T\mathbf{x}-f\left(\mathbf{x}\right) f∗(y)=xmaxyTx−f(x)
norm
f ( x ) = ∥ x ∥ f\left(\mathbf{x}\right) = \|\mathbf{x}\| f(x)=∥x∥
f ∗ ( y ) = { 0 , ∥ y ∥ ∗ ≤ 1 + ∞ , ∥ y ∥ ∗ > 1 f^*\left(\mathbf{y}\right)=\begin{cases} 0, &\|\mathbf{y}\|_*\le 1\\ +\infty, &\|\mathbf{y}\|_*>1 \end{cases} f∗(y)={
0,+∞,∥y∥∗≤1∥y∥∗>1
其中 ∥ ⋅ ∥ ∗ \|\cdot \|_* ∥⋅∥∗为对偶范数
证明:
当 ∥ y ∥ ∗ ≤ 1 \|\mathbf{y}\|_*\le 1 ∥y∥∗≤1时
y T x ≤ ∥ x ∥ ∥ y ∥ ∗ ≤ ∥ x ∥ \mathbf{y}^T\mathbf{x}\le \|\mathbf{x}\|\|\mathbf{y}\|_*\le \|\mathbf{x}\| yTx≤∥x∥∥y∥∗≤∥x∥
取 x = 0 \mathbf{x}=\mathbf{0} x=0,取等
f ∗ ( y ) = y T x − ∥ x ∥ = 0 f^*\left(\mathbf{y}\right)=\mathbf{y}^T\mathbf{x}-\|\mathbf{x}\|=0 f∗(y)=yTx−∥x∥=0
当 ∥ y ∥ ∗ > 1 \|\mathbf{y}\|_*> 1 ∥y∥∗>1时
由对偶范数定义
∥ y ∥ ∗ = max ∥ x ∥ ≤ 1 x T y > 1 \|\mathbf{y}\|_*=\max_{\|\mathbf{x}\|\le1} \mathbf{x}^T\mathbf{y}>1 ∥y∥∗=max∥x∥≤1xTy>1
即存在 x \mathbf{x} x,满足 ∥ x ∥ ≤ 1 , x T y > 1 \|\mathbf{x}\|\le 1,\mathbf{x}^T\mathbf{y}>1 ∥x∥≤1,xTy>1
f ∗ ( y ) = max x y T x − ∥ x ∥ ≥ y T ( t x ) − t ∥ x ∥ = t ( y T x − ∥ x ∥ ) \begin{aligned} f^*\left(\mathbf{y}\right) &=\max_{\mathbf{x}} \mathbf{y}^T\mathbf{x}-\|\mathbf{x}\|\\ &\ge \mathbf{y}^T\left(t\mathbf{x}\right)-t\|\mathbf{x}\|\\ &=t\left(\mathbf{y}^T\mathbf{x}-\|\mathbf{x}\|\right)\\ \end{aligned} f∗(y)=xmaxyTx−∥x∥≥yT(tx)−t∥x∥=t(yTx−∥x∥)
(第二行是因为 x \mathbf{x} x有任意性,所以代入 t x t\mathbf{x} tx也是会成立的)
当 t → ∞ t\to \infty t→∞时, f ∗ ( y ) → ∞ f^*\left(\mathbf{y}\right)\to \infty f∗(y)→∞