Paper Reading Note

URL:
https://cg.cs.tsinghua.edu.cn/papers/CVPR-2019-Drawing.pdf

TL;DR

CVPR2019一篇来自清华大学的文章，主要设计了一种GAN的结构APDrawingGAN，实现了利用GAN做人脸肖像画生成。

Motivation

肖像画不同于一般的轮廓，在保证人脸各部位特征的同时还需要具备一定的抽象美：
在这里插入图片描述
从左向右为原图 NPR模型 NPR加上下巴轮廓引导 APDrawingGAN

而SOTA的GAN方法在做这个任务时要么就会改变人脸部特征（1-4），要么会犯错（5-6）：
在这里插入图片描述

Algorithm

在这里插入图片描述

Generator部分

Generator采用的结构是global net+local net。global部分用的是一个8层*2的U-Net结构，用于提取图片的全局特征。local部分将左眼等六个local属性单独提取出来，用了3层*2和4层*2的U-Net，这里对每一个local feature都添加了一个L1的loss：
在这里插入图片描述
提取之后通过一个fusion net将二者结合，得到fake image。
计算这里的损失是本文的一个亮点。由于与以往的任务不同，本文的任务目标是黑色线条构成，因此如果计算pixel-wise的loss会有较大的误差。这里作者用了一个DT Loss：
在这里插入图片描述
其中用于表示两张图的distance的函数：

这里定义的意思就是对于每个pixel，去找离他最近的原图中pixel，计算之间的的距离。