La herramienta de dibujo de IA DragGAN nació de la nada, "un cabello puede mover todo el cuerpo"

Recientemente, investigadores de Google, junto con el Instituto Max Planck de Informática y MIT CSAIL, lanzaron una herramienta de edición de imágenes llamada DragGAN. Esta es una herramienta de edición de imágenes muy intuitiva, los usuarios solo necesitan controlar los píxeles y la dirección de la imagen para deformarla.

Puede que no sea intuitivo ver esa descripción, ¿por qué no echa un vistazo a la imagen GIF a continuación? En una frase, DragGAN permite a los usuarios ajustar rápidamente la posición, la postura, la expresión, el tamaño y el ángulo del sujeto de la foto.

Hoy en día, existen muchas herramientas para convertir texto en imágenes, pero las palabras que ingresa pueden no ser exactamente iguales a la imagen final que desea, y puede haber algunas desviaciones en varios aspectos, como el tamaño y el ángulo . Lo realmente interesante de DragGAN es que no solo puede generar imágenes realistas, sino también controlar las imágenes de manera flexible y precisa.

A diferencia de muchos enfoques anteriores, los investigadores de DragGAN proponen un marco general al no depender de redes auxiliares o modelos específicos de dominio. Para lograr esto, DragGAN consta de dos componentes principales: supervisión de movimiento basada en funciones, que guía los puntos de control hacia las ubicaciones de destino, y un nuevo método de seguimiento de puntos, que utiliza funciones de generador discriminativo para localizar las ubicaciones de los puntos de control.

Los investigadores dicen que su método supera a SOTA en operaciones basadas en GAN y abre nuevas direcciones para la edición de imágenes. En los próximos meses, esperan extender la edición basada en puntos a modelos generativos 3D.

Si bien el código del proyecto no se lanzará hasta junio, actualmente tiene 4800 estrellas en GitHub .

Supongo que te gusta

Origin www.oschina.net/news/241825/google-draggan
Recomendado
Clasificación