被吹爆的DragGAN到底酷不酷

你是否有想过P图只需要拖动鼠标,比如你想让一个双唇紧闭,眉头紧蹙的美女微笑,只需要网上拖动下嘴唇,图片中美女立马就变得喜笑颜开。还别说,真有人干出了这件事情,前段时间被吹爆的DragGAN放出了官方效果图,下面就带领各位一起领略一下。

01

DragGAN简介

    顾名思义,通过DragGAN,我们可以任意拖动图像进行编辑,无论是对象的形状、布局、姿态、表情、位置、大小,都可以做到精准控制。

在确定关键点的起始和终止位置之后,再根据对象的物理结构,用GAN生成符合逻辑的图像,一张挑不出破绽的图就做好了。

模特的姿势可以随意改变,短裤可以变成九分裤,短袖可以变长袖。

69b2b91830be877807dd6c56f099aac4.gif

看上去效果不错,实际操作起来的效果会差强人意还是完美复制呢,在6.25号晚上,作者也悄然发布了源码,既然开源,我们没有理由不去实际跑跑看效果。XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023) (github.com)

02


源码实操

    直接clone下来代码,源码有conda的yaml文件,但是没有requirments.txt文件,但是根据作者的提示,需要根据styleGAN3的环境来进行配置,那自然少不了

pip install torch torchvision Ninja gradio huggingface_hub hf_transfer

然后根据提示下载模型sh scripts/download_model.sh,然后启动

python visualizer_drag_gradio.py

遗憾的是,windows下环境配置实在是太拉了,只能借助其他大神的gui来先看看效果,遗憾的是不能用自己的图片。

96b9235b5c3ffc3829734cc906980fab.png

868d7972600a882775b6b4dce384d589.png

5edcd2c796b72f47624cb54a3835515f.png

作者文章最后说是代码大部分借鉴了StyleGAN3以及StyleGAN-human

698740509e4cf51c1a1baa1ebdea2d3c.png

所有后续我们就继续玩一玩styleGAN3,应该也能实现类似的效果

整体来说,DragGAN的主要实现还是基于styleGAN,想法很新颖,所以你说酷还是不酷。

喜欢的朋友点个关注点个赞

猜你喜欢

转载自blog.csdn.net/wutao22/article/details/131428034