Desbloquea las habilidades ocultas de Midjourney: cambia el mensaje y la cuadrícula de cuatro cuadrados se "fisionará"

La fuente de este artículo es el corazón de la máquina Editor: Zhang Qian

¿No estamos lejos de la verdadera "película de IA"?

Midjourney es una herramienta de diagramas de Vincent que mucha gente utiliza. Combinado con la herramienta de generación de video Runway Gen2 recientemente actualizada, incluso puedes crear un avance de película tú mismo. Los avances de las películas de "Trailer: Genesis" ("Genesis") y "The Wandering Earth 3" que han sido muy populares en las redes sociales recientemente. se basan en estos generados por herramientas de IA.

Sin embargo, estos "trailers" tienen algunas limitaciones, como la corta duración y la falta de cambios en la imagen. Para superar estas limitaciones, cómo hacer un mejor uso de las herramientas mencionadas se ha convertido en un problema difícil para todos los productores.

Recientemente, un blogger de Twitter llamado "Chase Lean" "descubrió nuevas tierras" en el uso de Midjourney. Dijo que siempre que uses algunas habilidades en Prompt, puedes dejar que Midjourney genere varias imágenes de personajes altamente consistentes (Midjourney genera 4 imágenes de personajes relativamente aleatorias de forma predeterminada), y los ángulos de disparo y los entornos de los personajes pueden ser muy diversos. de. Si se utiliza en la producción de los avances de películas mencionados anteriormente, esto equivale a proporcionar materiales más diversos para el productor, y el video generado en base a esto tendrá más narración.

955dfb7e149ffaf9004d32bd1d8734e0.png

¿Cómo lo hace Chase Lean? Tomando como ejemplo la generación de 6 imágenes del mismo personaje a la vez, su método es agregar "dividir en 6 imágenes diferentes, tomadas desde múltiples ángulos" en el mensaje. Sin embargo, este método no es el primero de Chase Lean. Dijo que su inspiración vino de un blogger de Twitter llamado "juliewdesign_", quien descubrió el uso mágico de "imagen dividida en 2" en Prompt (generando dos imágenes con el mismo carácter).

cfe36d7f4c56f1cc93921b965b77ab3d.png

Chase Lean continúa con este enfoque y lo amplía. Por ejemplo, puede presionar el botón "V4" para hacer que las imágenes generadas sean más variadas (V1, V2, V3 y V4 corresponden a las cuatro imágenes generadas, haga clic en uno de los botones y el sistema impulsará los ajustes detallados de la cuatro imágenes correspondientes Versión).

cfc2aadc719d8e093d720eed516208a1.png

Aquí están los resultados de los cambios:

a1e4f7beddb4138579ddb28a79da475d.png

Lo que es más interesante es que si combinas la función " Alejar " lanzada por Midjourney en junio , puedes incluso obtener más imágenes (presiona el botón Alejar para incluir una imagen más grande en la lente, como ajustar la distancia focal, y completar el acercamiento). -hasta la vista lejana. Switch, la versión Midjourney 5.2 ofrece tres opciones de zoom, que son 1,5 veces, 2 veces y zoom personalizado entre "1,0 y 2,0"):

2e311451a107aa3ecc70a28e97a96836.png

Repita las operaciones anteriores de "cambio", "zoom" y otras operaciones; en teoría, puede obtener un número infinito de imágenes del mismo personaje.

Si desea cambiar el fondo (entorno) de la imagen, primero puede seleccionar la imagen que desea modificar (presione los botones U1-U4) y luego presione el botón "Zoom personalizado", que permite al usuario hacer zoom en la pantalla y modifique el mensaje al mismo tiempo. En este punto, agregue palabras de entornos personalizados como playa y ciudad al mensaje, y podrá obtener varias imágenes de la misma escena del personaje.

b368a94fe6adc9b05f3db0972a77b2da.png

Como puede ver en los gráficos generados, algunos de los gráficos son en realidad de tamaño muy pequeño y la imagen del entorno está incompleta. Para solucionar este problema, Chase Lean recomienda utilizar la función "Uncrop" en el sitio web de Clipdrop.

1d054bd8b0c9b5080d1e2f85f4431b14.png

Chase Lean dijo que este método de generar múltiples imágenes a la vez y mantener los personajes consistentes tiene muchos usos en la realidad y lo ha probado en varios escenarios, como la moda, la familia y la animación.

19b2acaaa6dfd8b2017965d49d9e401d.png

Uno de los escenarios más interesantes fue la creación de cómics para niños. Por ejemplo, con "un niño surfeando en la playa, olas azules, palmeras, 3D, motor irreal; dividido en 4 imágenes diferentes, tomadas desde múltiples ángulos —niji—estilo expresivo" como mensaje, Chase Lean generó las siguientes 8 imágenes a la vez imagen.

56fe286194bbbfd46d0ccd76c5f80b32.png

Al presionar el botón "Alejar 2x", obtuvo más imágenes:


74d2c0e000d85589a1327c172cd00e76.png

Un método tan simple es tan efectivo que el intercambio de Chase Lean ha inspirado a muchas personas.

1fb23cc6c61a502cb4be67429b1a05e8.png

Alguien ha seguido los pasos para "reproducir" el efecto que mostró Chase Lean en Twitter.

b81c8172ad26f9b3bcb8b6438f09f779.png

A este ritmo de progreso, es posible que no estemos lejos de ver una verdadera "película de IA".

Enlace de referencia: https://twitter.com/chaseleantj/status/1693246015124713634

Preste atención a la cuenta oficial [Aprendizaje automático y creación de generación de IA], hay más cosas interesantes esperando que lea

¡Tumbado, 60.000 palabras! ¡130 artículos en 30 direcciones! ¡El documento AIGC más completo de CVPR 2023! léelo de una vez

Explicación simple de la difusión estable: interpretación del modelo de difusión potencial detrás de la tecnología de pintura con IA

¡Explicación detallada de ControlNet, un algoritmo de generación de pintura AIGC controlable! 

Classic GAN tiene que leer: StyleGAN

a36705351f7fe092899eb55f9d5387e2.png ¡Haz clic en mí para ver los álbumes de la serie GAN ~!

¡Una taza de té con leche, conviértete en la frontera de la visión AIGC + CV!

¡El último y más completo resumen de 100! Generar modelos de difusión Modelos de difusión

ECCV2022 | Resumen de algunos artículos sobre la generación de redes de confrontación GAN

CVPR 2022 | Más de 25 direcciones, los últimos 50 artículos de GAN

 ICCV 2021 | Resumen de artículos de GAN sobre 35 temas

¡Más de 110 artículos! CVPR 2021 peinado de papel GAN ​​más completo

¡Más de 100 artículos! CVPR 2020 peinado de papel GAN ​​más completo

Desmantelando la nueva GAN: desacoplando la representación MixNMatch

StarGAN Versión 2: Generación de imágenes de diversidad multidominio

Descarga adjunta | Versión china de "Aprendizaje automático explicable"

Descarga adjunta | "Algoritmos de aprendizaje profundo de TensorFlow 2.0 en la práctica"

Descarga adjunta | "Métodos Matemáticos en Visión por Computador" compartir

"Una revisión de los métodos de detección de defectos superficiales basados ​​en el aprendizaje profundo"

Un estudio sobre la clasificación de imágenes de disparo cero: una década de progreso

"Un estudio sobre el aprendizaje en pocas oportunidades basado en redes neuronales profundas"

"Libro de los Ritos · Xue Ji" tiene un dicho: "Aprender solo sin amigos es solitario e ignorante".

¡Haga clic en una taza de té con leche y conviértase en el líder de la visión AIGC+CV! , ¡únete  al planeta de la creación generada por IA y  el conocimiento de la visión por computadora!

Supongo que te gusta

Origin blog.csdn.net/lgzlgz3102/article/details/132506117
Recomendado
Clasificación