[论文理解]生成的敵対ネットワークの「操縦性」について

生成的な敵対ネットワークの「操縦」で

イントロ

本稿では、実装外潜在空間を編集することにより、潜在空間GANのための方法動作を提案サンプル、例えば位置制御等の基本的な特性を、生成された対照試料、照明、試料の生成等の、二次元、三次元の回転の回転を生成します。

記事の主な貢献は次のとおりです。

  1. 実績のある人間のようなカメラの動き、色変換などの操作の世界を実現するために「歩く」の潜在空間で実装、これらの操作は、自己学習の仕方によって監督されています。
  2. 出力フィールドの線形変換を達成するために、だけでなく、出力フィールドの非線形変換を達成するためだけでなく。
  3. 定量化されたデータセットは、変換を最大化することを学ぶことができます。

GANは、マッピングの一学習するように訓練することができるように、\(G(Z)\ RIGHTARROW X \) すなわち画像のサンプルの分布のマッピングに潜在空間サンプリング結果。したがって、潜在空間を変換する変換を学ぶことができるだけでなく、画像の分布をマッピングするために、と考えるのが自然でしょうか?著者らは、「歩く」、形質転換における潜在空間の即ち実装を呼び出し、結果として得られる画像は、得られた画像があっても、サンプルの外部で生成させることができる調整するために、適切な変換を行います。

目的

\ [\オメガ^ * = \ mathop {argmin} _ \オメガ\ mathbb {E} _ {Z、\アルファ} [\エル(G(Z + \アルファ\オメガ)、編集(G(z)は、\アルファ))] \]

、生成された画像に変換式の編集操作です\(\アルファが\)外部調整パラメータであり、\(\オメガ\)学習パラメータ、ルックスは非常に簡単です。ここでは画像を生成することができますGが受け戦闘訓練を持っていることは、よく訓練されていると考えられています。式は、それがニューラルネットワークはしばしば非線形非線形フィッティングによって活性化されるZの非線形フィット機能に対する操作非線形実際にあれば操作は、線形演算であることを前提とし、フィッティングは、ステップ変化であるべきです。だから、再帰は、変換のn変換の倍NSTEPです。
\ [\エル= \ mathbb {
E} _ {Z、N} || F ^ N(Z)-edit(G(z)は、N \イプシロン)||] \] ここで、nは、n番目のステップ、\(\イプシロン\)ステップサイズを表し、\(F ^ N(Z)を\)は、n番目の再帰関数。

定量化操縦性

この論文はまた、効果を定量化するために、形質転換の前及び後の変換の指標定量的な比較を、提案しています。

色変換のために、量子化インデックスをランダムに100個のピクセルを1に正規化し、前と変換後の画素値の変化が選択されます。

ズームやシフト変換のために、量子化インデックスは、ボックス正規の幅と高さで割ったオブジェクトの検出対象ネットワーク中心位置から出力されます。

変換の制限を削減

その上で、Gの場合には、あなたが直接トレーニングを終了する終了することができ、潜在空間を変換学ぶために行くことを決定?可能明らかである。
\ [G ^ * \オメガ^ * = \ mathop argmin {_ {G}、\オメガ}(\ ell_編集} + {GANを{ell_ \})\]
直接エンドトレーニングに、GAN元による損失、編集損損失はオリジナルと編集された後に入力を得るために行うことができますが。

実験の部には興味を持って、長すぎるではありません。

代码已开源:https://ali-design.github.io/gan_steerability/

おすすめ

転載: www.cnblogs.com/aoru45/p/12244447.html