英伟达AI：修图软件千千万，效果最牛的还是我这款

你明白的，对于大部分图像编辑软件来说，平时用它们修修脸、加个滤镜什么的，效果相当好。

但是当你用它们“修补”照片的时候，表现就不那么亮眼了。通常图像编辑工具可以借用相邻区域的像素（比如Photoshop就是这么操作的）填补缺失部分，但缺点很明显：无法确定图像本来缺失的内容。

因此只能用它们修补边边角角，不能从整体上复原图像。这个缺点在修复照片时暴露无遗，特别是当你想修补一张几十年前的老照片，而且你知道照片缺失部分原来都有什么。

不过不要紧，AI 已经解决了这个问题。最近英伟达的研究人员研发出一种极其先进的深度学习技术，能够复原图像原本缺失的内容。比如说，假如有一张缺失了眼睛部分的人脸照片，往常你用 Photoshop 这些编辑工具修补的话，只能用相邻部分的像素填充，无法还原出人的眼睛，但是英伟达研发的这个 AI 知道往缺失部分填补人的眼睛，哪怕结果有时看着不是很协调。

其实在此之前也有不少人尝试用基于 AI 的技术修补图像，但都局限于修复矩形截面，只重点关注图像中心部分的修复，无法修补照片的任意缺失部分，而且往往还需要花费大量的时间进行后期处理,但是英伟达的 AI 不一样。

它能够稳定地处理任何形状、大小或与照片边缘任意距离的缺失部分。更厉害的是，哪怕照片缺失部分在不断变大，AI 也能从容应对，优雅地修复。

为何这个 AI 如此厉害？

研究人员在他们发布的论文中解释到，他们应用了一种叫做“部分卷积”（partial convolution）的方法，也就是为神经网络添加一个部分卷积层，它包括掩膜式再归一化卷积以及掩膜更新两个部分，掩膜式再归一化卷积在图像分割任务中又称为 segmentation-aware卷积。这种技术能保证模型用于修补缺失像素的输出不会完全依赖输入值，从而能修补任意形状、大小和位置的缺失部分。部分卷积层能够根据对应接受域的正确性，再归一化每个输出，从而确保输出值独立于每个接受域的缺失像素值。另外研究人员也应用了一些损失函数、匹配特征损失的 VGG 模型以及风格损失等，让 AI 的生成结果更逼真更匹配。

这样 AI 对图像的修补效果，简直是不可思议的好，即便 AI 无法确切地知道缺失了什么，修复的结果往往看起来也非常贴合，毫无违和感。

AI补图大师是如何炼成的？

为了训练这个 AI，也是费了很大力气。研究人员首先制作了 55,116 张存在任意形状和大小缺失部位的掩膜图像用于训练，又准备了约 25,000 张用于测试。接着他们进一步将这些图像根据缺失部分大小细分为 6 个类别，以优化 AI 的复原效果。

借助英伟达 Tesla V100 GPU 和 cuDNN 驱动的深度学习框架 PyTorch，研究人员将前面制作的掩膜图像应用在来自 ImageNet，Place2 和 CelebA-HQ 数据集中的图像上，以此训练搭建的模型。

在训练阶段，研究人员将图像缺失部分引入来自这些数据集中的完整训练图像，以此让 AI 学习如何重建图像缺失的像素。

而在测试阶段，研究人员将没有应用在训练阶段的图像缺失部分引入到测试图像中，从而无偏差的验证 AI 重建缺失像素的准确率。

最终训练成的这款 AI 模型，修补图像的效果秒杀其它一众图像修补技术。在论文中，研究人员和其余四种图像修补技术进行了比较，这四种技术分别是：

PatchMatch：简称 PM，是当前非常先进的一款没有基于机器学习技术的图像修补方法。
GL：由 Iizuka 等人提出的图像修补技术。
GntIpt：由 Yu.J 等人提出的借助语境关注的生成式图像修补方法。
Conv：没有应用“部分卷积”的一种传统神经网络架构。

研究人员将他们研发出的 AI 命名为 PConv，下图展示了这 5 种方法修补相同图像的结果对比：

不光是修复景物和动物，也能修补人脸：

我们可以看到，无论是什么样的图像，英伟达的这款AI修复效果都远高于其它方法。更多效果可以戳这里。

当然 AI 的修图结果也不是一直完美无缺，你在视频中会发现有些脸部特征明显是从别处“借”来的，如果缺失部分面积很大，没有足够信息供 AI 重建像素时，AI 修复的效果就比较逊色。

但总体来看，这仍然不失为一种无比神奇和惊艳的实用技术。有了它，以往一些看似没有希望复原的照片都能够最大程度的还原缺失内容，而且不用花好几个小时痛苦的修补。另外，英伟达研究人员称 AI 还能在保证图像不失真的情况下放大照片。或许，我们苦哈哈的用修图工具补图抠图的日子就要一去不复返了。

为何这个 AI 如此厉害？

AI补图大师是如何炼成的？

猜你喜欢

目录

热门文章