移行スタイル紙は芸術スタイルの-A-ニューラルアルゴリズムを理解します

ディレクトリ

  1. 全体的なアイデア
  2. 原理の理解
  3. 練習

2015年、論文「芸術スタイルのAニューラルアルゴリズム」、学習の深い学習芸術的画風の最初の使用を公表Gatys、。普通の写真は、絵のスタイルを「与えます」。組換え魂と体2つの異なるオブジェクトの場合。本論文では、この論文に基づいていますし、私の愚見下の記事の首長の一部は述べています。

まず、全体的なアイデア

技術の主な目的は、最後の画像が両方のジャムを原画像の一般的なコンテンツを生成するだけでなく、参照ピクチャスタイル表示することができ、元の画像の別のスタイルに参照ピクチャの形式変換を使用することである(スタイル)  。ここで絵のスタイルは、テクスチャ、色、視覚パターンの狭い意味を指したというように、例えば、テクスチャ特徴がある場所に依存しないで、この特性に基づいて、長い統計や位置に依存しないなどとして、あなたはテクスチャを表現しようとすることができますそれは備わっています。コンテンツ  (コンテンツ)は、  ピクチャのマクロ構造を意味します。

プロセスは、一般に、入力画像がホワイトノイズである、損失関数は、すなわち、最終的な出力画像が得られ、連続して入力画像の画素値を補正することによって最適化されます

説明

コンテンツ図:ノーマル絵、あなたは移行されたスタイルをテーマに絵を持っている必要があります。

図スタイル:スタイル絵画やテクスチャ画像の一般的な使用のイメージを有します。

図ホワイトノイズ:図初期生成された画像

VGG:他の人がモデルを訓練されていることを事前にトレーニングモデル

ステップ

  1. 第一のコンテンツ及びスタイル図図入力が後VGGを「供給」、およびターゲット・コンテンツ図スタイル図のターゲット(入力回のみ)を生成する、損失計算としてターゲット画像を生成します。
  2. 合成画像の初期化:合成画像を初期化するために途中でここにホワイトノイズマップの内容を追加し、画像が合成画像を取得するには、VGG「供給」ホワイトノイズになります。
  3. ロード前のトレーニングモデル:コンテンツ情報の取得には、スタイルの損失を取得し、コンテンツの損失、スタイル情報のキャプチャを取得します
  4. 全損失の値が計算されます。ここでは、両方のは、一定の重みを設定するには、全損失を得るために、スタイルのコンテンツ損失+損失に使用されました
  5. 最適化機能:この関数はAdamOptimizerを使用して最適化されています
  6. トレーナー

第二に、理解の原則

コンボリューション(畳み込み)は、有効な局所特徴抽出操作です。深さの研究では、「深い」することができた理由の一つは、効率的な特徴抽出を完了するためのパラメータ少量の前の層の畳み込みです。imagenet 13年のチャンピオン、疑いの特徴抽出モデルVGG能力など。最初のステップは、スタイル(スタイル)をマッピングし、入力元スタイル転送VGGネットワ​​ークアルゴリズムの内容(コンテンツ)をマッピングすることであり、結果CONV1〜conv5が保存されています。絵に続いて、結果は抽象後ろに見ることができます。

図を見ることができる:ネットワークは、異なるレベルの画像情報の異なるレベルについて説明:小規模エッジ、曲線、ブロックレベルの記述、スパイラル、ハイレベルの記述の低レベルの記述を。

抽象化の機能をさまざまなレベルでは、次のステップは、ブレンドすることです。次のように画像の生成のために、私たちは、「スタイル」近接描画スタイル(スタイル)「スケルトン」近いマップの内容(コンテンツ)にそれをしたいです:

2.1 全体的な損失が定義されています。

私たちは、元の画像と画像コンテンツ生成が少なく、全体的な損失関数ので、より良い最終結果も近い優れている一方で、より良い近い参照画像と映像スタイルを生成することを数式手段。次のように元のテキストでの関数の式:

これでは、特定の状況の内容とスタイルは、下記を参照してください。

2.2 コンテンツの損失コンテンツ損失

畳み込みニューラルネットワークのより深い層は、よりグローバルな絵、要約情報、及び画像を定義するためにニューラルネットワークのコンボリューション出力レベルの活性化関数を使用し、したがって紙を抽出することができるしながら画像の主な内容は、そのマクロ経済フレームワークおよび輪郭を指しコンテンツ、画像や測定可能な目標にグラフィックコンテンツ屈折率差を生成するには、ユークリッド距離(すなわちことです  contentlosscontentloss  ):

式の左辺は、L層を表し、原画像(P)及び生存(F)は右の対応する式に最小二乗法であり、例示されます。生存画像特徴マップFIJはI番目の出力のj番目の値を表しています。

誘導体は、そうで変化することを、最小二乗最小値を使用して得られたL個のピクチャ層生存 Fの原画像改質層の近似値 P

2.3 スタイル損失スタイル損失

「スタイル」は常に比較的空のものであったが、何の固定表現が存在しない、紙は同じで隠された層使用する  特徴マップ  間の  グラム  としても知られているスタイルマトリクスを表すために、「マトリックスのスタイルを。」アルゴリズムのコアがあり、それが原因でシミュレートされたテクスチャの大きな行列であり、トレーニング効果が良いようです。この詳細については、のNaiyan王勧告読む[1701.01036]神秘を解くニューラルスタイル転送をここでは簡単な説明 Gの行列:

左前記 GLはグラム行列に対応する図。L層の応答を示し、F.のIjのi番目の層の代表は、畳み込み図応答の(典型的には2ビット)を確認すべきである Kの要素。グラム行列の各要素は、2つの無関係な図の応答との間の製品の需要であり、相関の位置を見つけるためになるように、スタイル特性を反映することができます。

同ルーチンの次のと最後のセクション、各層のグラム行列機能として、グラムグラム行列の元の行列に近いも最適化問題であるように再構成された画像であるように。

最小二乗法を同じように使用するが、前記フロントバンド係数、 Eは、層の損失を表し、 N Gの* N行列はM * Mの大きさは、分母となるように、生存F G行列の行列のサイズです。Gは、Aは、画像マトリックス層のスタイルを表し、世代を表します。

同様に、実施形態勾配降下最適化目標に応じました。

各重み付け評価の前の発現。スタイルの全体的な損失を取得します。

もちろん、紙はまた、これらの超パラメータの調整を行い、スーパーた比較から出て発生する各種パラメータの影響を比較しました。

第三に、実際の動作

このプロセスは、以下のステップに分けることができます。

A.イメージ前処理(図コンテンツ、スタイル図)は、図に定義されたプレースホルダを生成します。

B.事前研修モデルのロード

ネットワークを実行しているC. 3つの図

D.内容の損失の計算

E.グラム行列が計算されます

F.スタイル損失の計算

G.損失や勾配概要

H.反復計算を図1に示します。

I.は図を生成するための最適化手法を選択します。

J.反復

おすすめ

転載: www.cnblogs.com/yifanrensheng/p/12547660.html