【计算机视觉】PixelRNN 讲解

任何的书写错误、排版错误、概念错误等,希望大家包含指正。

PixelRNN

论文信息

作者:Aaron van den Oord(Google DeepMind)

期刊:PMLR(JMLR)

发布时间与更新时间:2016.01.25 2016.02.29 2016.08.19

主题:计算机视觉、生成模型、自回归模型、LSTM、CNN

概述

在自然语言处理中,自回归的思想在生成类任务中的应用非常广泛,自回归模型通过联合概率分解为条件概率的乘积进行建模。渐渐地,自回归思想也被应用于图像生成任务中。

作者提出了四种自回归模型,三种基于 RNNs 的自回归模型(Diagonal BiLSTM、Row LSTM 和 Multi-Scale PixelRNN)和一种基于 CNNs 的模型(PixelCNN)。在模型训练阶段,RNNs 模型采用并行和串行两种计算方式,CNNs 模型采用全并行方式;在图像生成阶段,RNNs 模型和 CNNs 模型均采用串行计算方式,即根据已生成的像素信息生成之后的像素。

模型概述

在这里插入图片描述

图 1    模型框架

猜你喜欢

转载自blog.csdn.net/weixin_46221946/article/details/131335143