【コンピュータビジョン】PixelRNNの解説

文章の間違い、活字の間違い、概念的な間違いなどを修正していただければ幸いです。

ピクセルRNN

用紙情報

名前:Aaron van den Oord(Google DeepMind)

ジャーナル: PMLR (JMLR)

公開時期と更新時期:2016.01.25 2016.02.29 2016.08.19

トピック: コンピューター ビジョン、生成モデル、自己回帰モデル、LSTM、CNN

概要

自然言語処理では、自己回帰の考え方が生成タスクで広く使用されており、自己回帰モデルは結合確率を条件付き確率の積に分解することによってモデル化されます。徐々に、自己回帰的な考え方が画像生成タスクにも適用されます。

著者は、RNN に基づく 3 つの自己回帰モデル (Diagonal BiLSTM、Row LSTM、および Multi-Scale PixelRNN)、および CNN に基づく 1 つのモデル (PixelCNN) の 4 つの自己回帰モデルを提案しました。モデルのトレーニング段階では、RNN モデルは並列およびシリアル コンピューティング メソッドを使用し、CNN モデルは完全な並列コンピューティング メソッドを使用します。画像生成ステージでは、RNN モデルと CNN モデルの両方がシリアル コンピューティング メソッドを使用します。生成された画素の画素情報に基づいて生成するステップ。

モデル概要

ここに画像の説明を挿入します

図 1 モデルの枠組み

おすすめ

転載: blog.csdn.net/weixin_46221946/article/details/131335143