对偶范数共轭

Young’s inequality

a b ≤ a p p + b q q ab \le \frac{a^p}{p} + \frac{b^q}{q} abpap+qbq
其中 a ≥ 0 , b ≥ 0 , p > 1 , q > 1 , 1 p + 1 q = 1 a\ge0,b\ge0,p>1,q>1,\frac{1}{p}+\frac{1}{q}=1 a0,b0,p>1,q>1,p1+q1=1
当且仅当 a p = b q a^p=b^q ap=bq时取等

证明:
a = 0 a=0 a=0 b = 0 b=0 b=0时显然成立

a > 0 , b > 0 a>0,b>0 a>0,b>0
由Jensen不等式
ln ⁡ ( a p p + b q q ) ≥ 1 p ln ⁡ a p + 1 q ln ⁡ b q = ln ⁡ a b \begin{aligned} \ln\left( \frac{a^p}{p} + \frac{b^q}{q}\right)\ge \frac{1}{p}\ln a^p + \frac{1}{q}\ln b^q=\ln ab \end{aligned} ln(pap+qbq)p1lnap+q1lnbq=lnab
当且仅当 a p = b q a^p=b^q ap=bq时取等

Hölder’s inequality

∑ i = 1 n ∣ x i y i ∣ ≤ ∥ x ∥ p ∥ y ∥ q \sum_{i=1}^{n}\left|x_iy_i\right|\le \|\mathbf{x}\|_p \|\mathbf{y}\|_q i=1nxiyixpyq
其中 p ≥ 1 , q ≥ 1 , 1 p + 1 q = 1 p\ge 1, q\ge 1,\frac{1}{p}+\frac{1}{q}=1 p1,q1,p1+q1=1
∥ x ∥ p = ( ∑ i = 1 n ∣ x i ∣ p ) 1 p \|\mathbf{x}\|_p=\left(\sum_{i=1}^{n}\left|x_i\right|^p\right)^{\frac{1}{p}} xp=(i=1nxip)p1

当且仅当 x = 0 \mathbf{x}=\mathbf{0} x=0 y = 0 \mathbf{y}=\mathbf{0} y=0,或 ∃ c 1 , c 2 > 0 \exists c1,c2>0 c1,c2>0,使得 c 1 ∣ x i ∣ p = c 2 ∣ y i ∣ q c_1\left|x_i\right|^p=c_2\left|y_i\right|^q c1xip=c2yiq

证明:
x = 0 \mathbf{x}=\mathbf{0} x=0 y = 0 \mathbf{y}=\mathbf{0} y=0时显然成立

x ≠ 0 , y ≠ 0 \mathbf{x}\neq \mathbf{0},\mathbf{y}\neq \mathbf{0} x=0,y=0

p = 1 p=1 p=1
∑ i = 1 n ∣ x i y i ∣ ≤ ( max ⁡ i ∣ y i ∣ ) ∑ i = 1 n ∣ x i ∣ = ∥ x ∥ 1 ∥ y ∥ ∞ \sum_{i=1}^{n} \left|x_iy_i\right|\le \left(\max_i \left|y_i\right|\right)\sum_{i=1}^{n}\left|x_i\right|=\|\mathbf{x}\|_1\|\mathbf{y}\|_\infty i=1nxiyi(maxiyi)i=1nxi=x1y
同理 q = 1 q=1 q=1

p > 1 p>1 p>1

A i = ∣ x i ∣ ∥ x ∥ p , B i = ∣ y i ∣ ∥ y ∥ q A_i = \frac{\left|x_i\right|}{\|\mathbf{x}\|_p}, B_i = \frac{\left|y_i\right|}{\|\mathbf{y}\|_q} Ai=xpxi,Bi=yqyi

由Young不等式
A i B i = ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p ∣ x i ∣ p ∥ x ∥ p p + 1 q ∣ y i ∣ q ∥ y ∥ q q A_iB_i = \frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q}\le \frac{1}{p}\frac{\left|x_i\right|^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{\left|y_i\right|^q}{\|\mathbf{y}\|_q^q} AiBi=xpyqxiyip1xppxip+q1yqqyiq

两边求和
∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ ∑ i = 1 n 1 p ∣ x i ∣ p ∥ x ∥ p p + 1 q ∣ y i ∣ q ∥ y ∥ q q ∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p ∑ i = 1 n ∣ x i ∣ p ∥ x ∥ p p + 1 q ∑ i = 1 n ∣ y i ∣ q ∥ y ∥ q q ∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p ∥ x ∥ p p ∥ x ∥ p p + 1 q ∥ y ∥ q q ∥ y ∥ q q ∑ i = 1 n ∣ x i y i ∣ ∥ x ∥ p ∥ y ∥ q ≤ 1 p + 1 q ∑ i = 1 n ∣ x i y i ∣ ≤ ∥ x ∥ p ∥ y ∥ q \begin{aligned} \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le \sum_{i=1}^{n}\frac{1}{p}\frac{\left|x_i\right|^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{\left|y_i\right|^q}{\|\mathbf{y}\|_q^q}\\ \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le\frac{1}{p}\frac{ \sum_{i=1}^{n}\left|x_i\right|^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{ \sum_{i=1}^{n}\left|y_i\right|^q}{\|\mathbf{y}\|_q^q}\\ \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le\frac{1}{p}\frac{ \|\mathbf{x}\|_p^p}{\|\mathbf{x}\|_p^p}+\frac{1}{q}\frac{ \|\mathbf{y}\|_q^q}{\|\mathbf{y}\|_q^q}\\ \sum_{i=1}^{n}\frac{\left|x_iy_i\right|}{\|\mathbf{x}\|_p\|\mathbf{y}\|_q} &\le\frac{1}{p}+\frac{1}{q}\\ \sum_{i=1}^{n}\left|x_iy_i\right| &\le \|\mathbf{x}\|_p \|\mathbf{y}\|_q \end{aligned} i=1nxpyqxiyii=1nxpyqxiyii=1nxpyqxiyii=1nxpyqxiyii=1nxiyii=1np1xppxip+q1yqqyiqp1xppi=1nxip+q1yqqi=1nyiqp1xppxpp+q1yqqyqqp1+q1xpyq

c 1 ∣ x i ∣ p = c 2 ∣ y i ∣ q c 1 ∑ i = 1 n ∣ x i ∣ p = c 2 ∑ i = 1 n ∣ y i ∣ q c 1 c 2 = ∥ y ∥ q q ∥ x ∥ p p \begin{aligned} c_1\left|x_i\right|^p &=c_2\left|y_i\right|^q\\ c_1\sum_{i=1}^{n}\left|x_i\right|^p &= c_2\sum_{i=1}^{n}\left|y_i\right|^q\\ \frac{c_1}{c_2} &=\frac{\|\mathbf{y}\|_q^q}{\|\mathbf{x}\|_p^p} \end{aligned} c1xipc1i=1nxipc2c1=c2yiq=c2i=1nyiq=xppyqq

c 1 ∣ x i ∣ p = c 2 ∣ y i ∣ q ∣ y i ∣ = c 1 c 2 ∣ x i ∣ p q ∣ y i ∣ = ∥ y ∥ q ∥ x ∥ p p − 1 ∣ x i ∣ p − 1 ∣ x i y i ∣ = ∥ y ∥ q ∥ x ∥ p p − 1 ∣ x i ∣ p ∑ i = 1 n ∣ x i y i ∣ = ∑ i = 1 n ∥ y ∥ q ∥ x ∥ p p − 1 ∣ x i ∣ p ∑ i = 1 n ∣ x i y i ∣ = ∥ x ∥ p ∥ y ∥ q \begin{aligned} c_1\left|x_i\right|^p &=c_2\left|y_i\right|^q\\ \left|y_i\right| &= \sqrt[q]{\frac{c_1}{c_2}\left|x_i\right|^p}\\ \left|y_i\right| &= \frac{\|\mathbf{y}\|_q}{\|\mathbf{x}\|_p^{p-1}}\left|x_i\right|^{p-1}\\ \left|x_iy_i\right| &= \frac{\|\mathbf{y}\|_q}{\|\mathbf{x}\|_p^{p-1}}\left|x_i\right|^{p}\\ \sum_{i=1}^{n}\left|x_iy_i\right| &= \sum_{i=1}^{n}\frac{\|\mathbf{y}\|_q}{\|\mathbf{x}\|_p^{p-1}}\left|x_i\right|^{p}\\ \sum_{i=1}^{n}\left|x_iy_i\right| &= \|\mathbf{x}\|_p \|\mathbf{y}\|_q\\ \end{aligned} c1xipyiyixiyii=1nxiyii=1nxiyi=c2yiq=qc2c1xip =xpp1yqxip1=xpp1yqxip=i=1nxpp1yqxip=xpyq

dual norm of p norm

∥ ⋅ ∥ \|\cdot \| 是定义在 R n \mathbb{R}^n Rn的范数
对偶范数 ∥ ⋅ ∥ ∗ \|\cdot \|_* 定义为
∥ z ∥ ∗ = sup ⁡ ∥ x ∥ ≤ 1 z T x \|\mathbf{z}\|_*=\sup\limits_{\|x\|\le 1} \mathbf{z}^T\mathbf{x} z=x1supzTx

也可以推出 x T z ≤ ∥ x ∥ ∥ z ∥ ∗ \mathbf{x}^T\mathbf{z}\le \|\mathbf{x}\|\|\mathbf{z}\|_* xTzx∥∥z

p norm

∥ z ∥ q = sup ⁡ ∥ x ∥ p ≤ 1 z T x \|\mathbf{z}\|_q=\sup\limits_{\|x\|_p\le 1} \mathbf{z}^T\mathbf{x} zq=xp1supzTx
其中 p ≥ 1 , q ≥ 1 , 1 p + 1 q = 1 p\ge 1, q\ge 1, \frac{1}{p}+\frac{1}{q}=1 p1,q1,p1+q1=1

证明:

z = 0 \mathbf{z}=\mathbf{0} z=0时,显然成立

z ≠ 0 \mathbf{z}\neq \mathbf{0} z=0
由Holder不等式
z T x ≤ ∑ i = 1 n ∣ z i ∣ ∣ x i ∣ ≤ ∥ x ∥ p ∥ z ∥ q ≤ ∥ z ∥ q \begin{aligned} \mathbf{z}^T\mathbf{x} \le \sum_{i=1}^{n}\left|z_i\right|\left|x_i\right|\le\|\mathbf{x}\|_p\|\mathbf{z}\|_q \le \|\mathbf{z}\|_q \end{aligned} zTxi=1nzixixpzqzq

下面验证一下取等
x i = sign ⁡ ( z i ) ∣ z i ∣ q − 1 ∥ z ∥ q q p x_i=\frac{\operatorname{sign}\left(z_i\right)\left|z_i\right|^{q-1}}{\|\mathbf{z}\|_q^{\frac{q}{p}}} xi=zqpqsign(zi)ziq1
∥ x ∥ p p = ∑ i = 1 n ∣ sign ⁡ ( z i ) ∣ z i ∣ q − 1 ∥ z ∥ q q p ∣ p = ∑ i = 1 n ∣ z i ∣ p q − p ∥ z ∥ q q = ∑ i = 1 n ∣ z i ∣ q ∥ z ∥ q q = ∥ z ∥ q q ∥ z ∥ q q = 1 \begin{aligned} \|\mathbf{x}\|_p^p&=\sum_{i=1}^n\left|\frac{\operatorname{sign}\left(z_i\right)\left|z_i\right|^{q-1}}{\|\mathbf{z}\|_q^{\frac{q}{p}}}\right|^p\\ &=\sum_{i=1}^n\frac{\left|z_i\right|^{pq-p}}{\|\mathbf{z}\|_q^q}\\ &=\sum_{i=1}^n\frac{\left|z_i\right|^{q}}{\|\mathbf{z}\|_q^q}\\ &=\frac{\|\mathbf{z}\|_q^q}{\|\mathbf{z}\|_q^q}\\ &=1\\ \end{aligned} xpp=i=1n zqpqsign(zi)ziq1 p=i=1nzqqzipqp=i=1nzqqziq=zqqzqq=1
于是
∥ x ∥ p ≤ 1 \|\mathbf{x}\|_p\le 1 xp1
因此
z T x = ∑ i = 1 n sign ⁡ ( z i ) ∣ z i ∣ q − 1 ∥ z ∥ q q p z i = ∑ i = 1 n ∣ z i ∣ q ∥ z ∥ q q p = ∥ z ∥ q q ∥ z ∥ q q p = ∥ z ∥ q \begin{aligned} \mathbf{z}^T\mathbf{x} &=\sum_{i=1}^{n}\frac{\operatorname{sign}\left(z_i\right)\left|z_i\right|^{q-1}}{\|\mathbf{z}\|_q^{\frac{q}{p}}}z_i\\ &=\sum_{i=1}^{n}\frac{\left|z_i\right|^{q}}{\|\mathbf{z}\|_q^{\frac{q}{p}}}\\ &=\frac{\|\mathbf{z}\|_q^q}{\|\mathbf{z}\|_q^{\frac{q}{p}}}\\ &=\|\mathbf{z}\|_q \end{aligned} zTx=i=1nzqpqsign(zi)ziq1zi=i=1nzqpqziq=zqpqzqq=zq

conjugate

f : R n → R f:\mathbb{R}^n\to \mathbb{R} f:RnR
共轭函数
f ∗ ( y ) = max ⁡ x y T x − f ( x ) f^*\left(\mathbf{y}\right) = \max_{\mathbf{x}}\mathbf{y}^T\mathbf{x}-f\left(\mathbf{x}\right) f(y)=xmaxyTxf(x)

norm

f ( x ) = ∥ x ∥ f\left(\mathbf{x}\right) = \|\mathbf{x}\| f(x)=x
f ∗ ( y ) = { 0 , ∥ y ∥ ∗ ≤ 1 + ∞ , ∥ y ∥ ∗ > 1 f^*\left(\mathbf{y}\right)=\begin{cases} 0, &\|\mathbf{y}\|_*\le 1\\ +\infty, &\|\mathbf{y}\|_*>1 \end{cases} f(y)={ 0,+,y1y>1

其中 ∥ ⋅ ∥ ∗ \|\cdot \|_* 为对偶范数

证明:
∥ y ∥ ∗ ≤ 1 \|\mathbf{y}\|_*\le 1 y1

y T x ≤ ∥ x ∥ ∥ y ∥ ∗ ≤ ∥ x ∥ \mathbf{y}^T\mathbf{x}\le \|\mathbf{x}\|\|\mathbf{y}\|_*\le \|\mathbf{x}\| yTxx∥∥yx
x = 0 \mathbf{x}=\mathbf{0} x=0,取等
f ∗ ( y ) = y T x − ∥ x ∥ = 0 f^*\left(\mathbf{y}\right)=\mathbf{y}^T\mathbf{x}-\|\mathbf{x}\|=0 f(y)=yTxx=0

∥ y ∥ ∗ > 1 \|\mathbf{y}\|_*> 1 y>1
由对偶范数定义
∥ y ∥ ∗ = max ⁡ ∥ x ∥ ≤ 1 x T y > 1 \|\mathbf{y}\|_*=\max_{\|\mathbf{x}\|\le1} \mathbf{x}^T\mathbf{y}>1 y=maxx1xTy>1
即存在 x \mathbf{x} x,满足 ∥ x ∥ ≤ 1 , x T y > 1 \|\mathbf{x}\|\le 1,\mathbf{x}^T\mathbf{y}>1 x1,xTy>1

f ∗ ( y ) = max ⁡ x y T x − ∥ x ∥ ≥ y T ( t x ) − t ∥ x ∥ = t ( y T x − ∥ x ∥ ) \begin{aligned} f^*\left(\mathbf{y}\right) &=\max_{\mathbf{x}} \mathbf{y}^T\mathbf{x}-\|\mathbf{x}\|\\ &\ge \mathbf{y}^T\left(t\mathbf{x}\right)-t\|\mathbf{x}\|\\ &=t\left(\mathbf{y}^T\mathbf{x}-\|\mathbf{x}\|\right)\\ \end{aligned} f(y)=xmaxyTxxyT(tx)tx=t(yTxx)
(第二行是因为 x \mathbf{x} x有任意性,所以代入 t x t\mathbf{x} tx也是会成立的)

t → ∞ t\to \infty t时, f ∗ ( y ) → ∞ f^*\left(\mathbf{y}\right)\to \infty f(y)

猜你喜欢

转载自blog.csdn.net/qq_39942341/article/details/131873487