DE-FAKE: Detection and Attribution ofFake Images Generated by Text-to-Image Generation Models

一、文章信息

论文名称:DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models

作者团队:

二、主要创新

本文的主要创新是开发了一种机器学习分类器,用于检测归因文本到图像生成模型生成的虚假图像。

该研究对四种流行的文本到图像生成模型进行了广泛的实验,包括DALL·E 2, Stable Diffusion, GLIDE, and Latent Diffusion,以及两个基准图像数据集MSCOCO和Flickr30k。

实验结果表明,可以将各种模型生成的虚假图像与真实图像区分开来,并且可以有效地将虚假图像归因于其源模型。

三、方法

1、检测,分为纯图像混合检测。

纯图像检测:检测器仅接受图像输入。

混合检测:接受图像和Prompt作为输入。图像与文本编码器均为CLIP的编码器。

 

扫描二维码关注公众号,回复: 15635507 查看本文章
  •  纯图像检测涉及三个阶段:数据收集、数据集构建和检测器构建。

数据收集:MSCOCO 的 20,000 张图像看作真实图像,并使用SD方法生成20,000张假图像,用于训练探测器,所有其他图像都用于测试探测器的性能。

数据集构建:假的图像标为0,真实图像标为1。

检测器构建:纯图像的使用ResNet18作为检测器。

  • 混合检测同样涉及三个阶段:数据收集、数据集构建和检测器构建

数据收集:与纯图像相同。

数据集构建:由于混合检测器需要图像和提示作为输入,我们标记所有假图像及其对应的提示为0,将真实图像及其对应的提示标记为1。然后我们创建一个训练数据集,总共包含40,000 个提示图像对。

检测器构建:利用了 CLIP 的图像编码器和文本编码器作为特征提取器以获得高级图像和提示的embedding。 然后,我们将图像嵌入和文本嵌入连接在一起作为新的embedding, 并使用这些embedding来训练二元分类器,即 检测器为2 层多层感知器。

实验结果:对于纯图像的检测器,在有些模型上性能良好,有些仅与随机猜想性能相同。但混合检测器对所有模型均表现良好。本质原因是:prompt不能完全反映真实图像的内容,但假图像纯粹是根据提示信息。 这表明假图像与其prompt之间的联系比真实图像与其提示之间的联系更紧密。 且假图像之间有某种共同信息以供检测。

2、归因,分为纯图像混合归因

纯图像归因:仅接受图像输入。

混合归因:接受图像和Prompt作为输入。图像与文本编码器均为CLIP的编码器。

  • 纯图像归因涉及三个阶段:数据收集、数据集构建、归因器构建

数据收集:首先随机抽样 20,000,来自 MSCOCO 的图像作为真实图像。 然后,我们使用这20,000张图像的提示查询每个模型相应地得到 20,000 张假图像。 在这里采用SD、LD 和 GLIDE 生成假图像。 总共获得了 60,000 张假图像。

数据集构建:标记所有真实图像为 0,标记来自SD/LD/GLIDE 为 1/2/3。 然后我们创建一个训练集包含总共80,000 张图像,其中有四个类。

归因器构建:一个接受图像的多类分类器,作为多类预测的输入和输出,即 0-真实、1-SD、2-LD 或 3-GLIDE。利用 ResNet18作为归因器框架。

  • 混合归因涉及三个阶段:数据收集、数据集构建、归因器构建

数据收集:与纯图像归因的数据收集一样

数据集构建:由于我们的混合归因以图像和提示作为输入,我们将所有带有相应提示的真实图像标记为 0,所有假图像来自同一模型及其对应的图像prompt为同一类。 同样,我们然后创建一个训练数据集,包含总共 80,000 个提示图像对,分为四个类别。

归因器构建:利用了 CLIP 的图像编码器和文本编码器作为特征提取器以获得高级图像和提示的embedding。 然后,我们将图像嵌入和文本嵌入连接在一起作为新的embedding, 并使用这些embedding来训练二元分类器,即 检测器为2 层多层感知器。

实验结果:加入prompt的图像归因性能更佳,每个文本到图像生成模型在其生成的假图像中留下了独特的指纹。

  •  什么样的prompt能生成更加真实的图片?

答:与人类相关且prompt长度在25-75之间的prompt能生成更加真实的图片。

  • 最有可能生成真实/虚假的5个prompt。

猜你喜欢

转载自blog.csdn.net/qq_43687860/article/details/130677486