近位のアルゴリズム2つのプロパティ

とに分けることができます

場合\(F \)は、 2つの変数に分割することができる\(F(X、Y)= \ varphi(X)+ \のPSI(Y)\)次に、:
ここに画像を挿入説明
場合\(F \)は、完全に分離可能です、その\(F(X)= \ sum_ {I = 1} ^ N-F_iと(X_I)\)
\ [(\ mathbf {Proxの} _F(V))_ I = \ mathbf {Proxの} _ {F_iと}(V_I )\]

このプロパティは、並列アルゴリズムの設計において非常に有用です。

基本的な操作

如果\(F(X)= \アルファ\ varphi(X)+ B \) \(\アルファ> 0 \)
\ [\ mathbf {PROX} _ {\ラムダF}(V)= \ mathbf {PROX } _ {\アルファ\ラムダ\ varphi}(V)\]

もし\(F(X)= \ varphi(\アルファX + B)\) \(\アルファ\ NE 0 \)
ここに画像を挿入説明
症候群:
\ [\ \ mathbf {アレイ} {LL}開始{Proxの} _ {\ラムダF}(V)&= \ mathrm {argmin} _x \ varphi(\アルファX + B)+ \ FRAC {1} {2 \ラムダ} \ | XV \ | _2 ^ 2 \\&= \ mathrm {argmin } _x \ varphi(Z)+ \ FRAC {1} {2 \ラムダ} \ |(ZB)/ \アルファ-v \ | _2 ^ 2 \\&= \ mathrm {argmin} _x \ varphi(Z)+ \ FRAC {1} {2 \ラムダ \アルファ^ 2} \ | ZB - \アルファVの\ | _2 ^ 2 \\&= \ FRAC {1} {\アルファ}(\ mathbf {PROX} _ {\アルファ^ 2 \ラムダの\ varphi}(\アルファ V + B) - B)\端{アレイ} \] \(Z = \アルファX + B \) 。、証明が完了した場合= \ \が(F(X) varphi(Qxを)\) および\(Q \)は直交行列である:\ [\ mathbf Proxの} _ {{\}ラムダF(V)= Q ^ T \ mathbf Proxの} _ {{\ラムダの\ varphi}(量Qv) \]


如果\(F(X)= \ varphi(X)+ A ^のTx + bは\) 则:
\ [\ mathbf {PROX} _ {\ラムダF}(V)= \ mathbf {PROX} _ {\ラムダ\ varphi}(V- \ラムダA)\]
证:
\ [\ \ mathbf {アレイ} {LLを}開始{PROX} _ {\ラムダF}(V)&= \ mathrm {argmin} _x \ varphi(X )+ A ^のTx + B + \ FRAC {1} {2 \ラムダ} \ | XV \ | _2 ^ 2 \\&= \ mathrm {argmin} _x \ varphi(X)+ \ FRAC {1} {2 \ラムダ}(X ^送信-2V ^のTx + 2 \ラムダA ^のTx)+ C \\&= \ mathrm {argmin} _x \ varphi(X)+ \ FRAC {1} {2 \ラムダ} \ | X- (V- \ラムダA)\ | _2 ^ 2 \\&= \ mathbf {PROX} _ {\ラムダ\ varphi}(V- \ラムダA)\端{アレイ} \]
其中\(C \)为与\(X \)无关的项。

もし\(F(X)= \ varphi(X)+(\のRho / 2)\ | X -a \ | _2 ^ 2 \) 次いで:
\ [\ mathbf Proxの} _ {{\}ラムダF(V )= \ mathbf {PROX} _
{\ widetilde {\ラムダ} \ varphi}大きい\((\ widetilde {\ラムダ} / \ラムダ)は、V +(\ロー\ widetilde {\ラムダ})\大きい)\] 前記\(\ widetildeラムダ\のRho \ラムダ/(1+ \ {\ラムダ} =)\) および証明は上記と同様であり、次の用語は、それを再組み立て。

固定小数点の固定点

ポイント\(X ^ * \)最小化\(Fを\) 場合に限り
、[(^ * X)\ X ^ * = \ mathbf {Proxの} _F] \
この説明、\(X ^ * \)があります\(\ mathbf {PROX} _fは \) 、この特性のために、固定点である\(\ラムダのF \)が確立されます。

ここに画像を挿入説明
圧縮マップが定義される:
マッピング検討:\((X、\のRho)の\ RIGHTARROW(X-、\のRho)\ T)が存在した場合。(0 <a <1 \ \ ) そのような任意のそれ\(X、Y \でX- \)をしている:
\ [\のRho送信(Tx、Tyの)<\のRho(X、Y)\]
と呼ばれる関数\(T \)がされている((X、\のロー\) \) 圧縮マップ自体に。

場合は\(\ mathbf {PROX} _fが \) 縮小写像である私たちは、最低検索したい場合は、明らかに、\(Fの\を)され(\ ^ * X-を)\:、あなたは次の反復使用することができます
\ [X-を^ {N + 1} = \
mathbf {PROX} _f(X ^ N)\ RIGHTARROW X ^ * \] のような\(\ mathbf {PROX} _f \) を満足\(L <1 \)リプシッツ条件について。

近位のオペレータは、このような性質を持っている:
ここに画像を挿入説明
ここにこのコンテンツについての議論があります。

\(x = \mathbf{prox}_f(v) \Leftrightarrow v-x \in \partial f(x)\),其中\(\partial\)表示次梯度.
\(u_1 = \mathbf{prox}_f(x), u_2 = \mathbf{prox}_f(y)\),则:
\[ x - u_1 \in \partial f(u_1) \\ y - u_2 \in \partial f(u_2) \]
因为\(f\)是凸函数,所以\(\partial f\)是单调增函数:
\[ <x - u_1 - (y-u_2), u_1-u_2> \ge 0 \\ \Rightarrow \|u_1 - u_2\|_2^2 \le (x-y)^T(u_1-u_2) \]
上面的单调增函数,翻译的估计不对,主要是我对这方面的只是也不了解,原文用的是monotone mapping, 我们来看凸函数\(f(x)\):
\[ f(y) \ge f(x) + \partial f(x)^T (y-x) \\ f(x) \ge f(y) + \partial f(y)^T(x-y) \]
相加即得:
\[ (\partial f(x) - \partial f(y))^T (x-y) \ge 0 \]
还有严格凸的情况下有个特殊情况,这个怎么证明啊...而且,似乎在不是严格凸的,利用上面的迭代公式也是能够收敛到不动点的,可似乎不满足不动点定理啊.

而且作者将这个与平均算子(averaged operators)联系起来:
\[ T = (1-\alpha)I+\alpha N, \alpha \in (0, 1) \]
以及迭代公式:
\[ x^{k+1}:=(1-\alpha ) x^k + \alpha N \]

Moreau decomposition

有以下事实成立:
ここに画像を挿入説明

以下的证明是属于
ここに画像を挿入説明
沿用其符号,令(注意是\(\inf\)不是\(\mathrm{argmin}\)
\[ f_{\mu}(x) = \inf_y \{f(y) + \frac{1}{\mu} \|x-y\|_2^2\} \]
我们可以其改写为:
ここに画像を挿入説明
注意\(-\sup A=\inf -A\)
假设\(f\)是凸函数且可微的,那么:
\[ f^*(y)={x^*}^T \nabla f(x^*) - f(x^*) \]
其中,\(x\)满足:\(y=\nabla f(x^*)\)。于是(注意\(\nabla f(x^*)=y\), 且上式是关于\(y\)求导):
\[ \nabla f^* (y) = x^* \]
这就是\(\nabla f_{\mu} (x)\)的由来.

我们再来看其对偶表示:
ここに画像を挿入説明
其拉格朗日对偶表示为:
ここに画像を挿入説明
如果满足强对偶条件:
ここに画像を挿入説明

従って:
\ [F _ {\ MU}(X)= FRAC \ {1} {MU \ 2} \ | X \ | ^ 2- FRAC \ {1} {\ MU}(\ MU F + \ FRAC {1} { 2} \ | \ CDOT \ | ^ 2)^ *(X)=(F ^ * + \ FRAC {\ MU} {2} \ | \ CDOT \ | ^ 2)^ *(x)は\\ \ RIGHTARROW \ FRAC {1} {2} \ | X \ | ^ 2 =(\ミューF + \ FRAC {1} {2} \ | \ CDOT \ | ^ 2)^ *(X)+ \ミュー(F ^ * + \ FRAC {\ MU} {2 } \ | \ CDOT \ | ^ 2)^ *(x)は\\ \ RIGHTARROW X = \ mathbf {PROX} _ {\ミューF}(X)+ \ミューの\ mathbf {PROX } _ {\ FRAC {1} {\ MU} F ^ *}(\ FRAC {X} {\ MU})= X = \ mathbf {PROX} _ {\ミューF}(X)+ \ mathbf {PROX} _ {(\ミューF)^
*}(X)\] 上記式の結果の最終工程は、誘導体が得られた両面右知らない\(\ MU = 1 \)式は特定の確立された:
\ [X = \ mathbf {} Proxの_F(X)+ \} _ {プロックスmathbf {*} ^ F(X)\]

おすすめ

転載: www.cnblogs.com/MTandHJ/p/10990368.html