Enseñe a Wen Xin Yiyan a generar palabras clave para pintar con IA (Midjourney)

Insertar descripción de la imagen aquí


Wen Xin Yi Yan apoya el diálogo continuo

Solo estoy tonteando y no soy profesional jaja

primer paso

Hola, hoy vamos a crear una imagen usando un modelo de difusión. Te daré alguna información. ¿DE ACUERDO?

Insertar descripción de la imagen aquí

Paso 2

Así es como funciona Midjourney: Midjourney es otra herramienta basada en inteligencia artificial que genera imágenes según las indicaciones del usuario. MidJourney se destaca al ajustar el estilo artístico real para crear cualquier combinación de imágenes que el usuario desee. Destaca en la creación de entornos, especialmente escenas de fantasía y ciencia ficción, con una iluminación espectacular que parece arte conceptual de videojuegos.

¿Cómo funciona Midjourney? Midjourney es una herramienta de generación de imágenes de IA que toma indicaciones de texto e ingreso de parámetros y utiliza algoritmos de aprendizaje automático (ML) entrenados en grandes cantidades de datos de imágenes para generar imágenes únicas. Desarrollado por Latent Diffusion Model (LDM), una tecnología de síntesis de texto a imagen de vanguardia. Antes de comprender cómo funciona ldm, primero veamos qué es un modelo de difusión y por qué necesitamos ldm. El modelo de difusión (DM) es un modelo generativo basado en transformadores que toma un dato, como una imagen, y gradualmente agrega ruido con el tiempo hasta que se vuelve irreconocible. A partir de ahí, intentan reconstruir la imagen en su forma original, aprendiendo cómo generar la imagen u otros datos en el proceso. El problema con DM es que un DM potente a menudo consume cientos de días de GPU y la inferencia es muy costosa debido al cálculo secuencial. Para permitir que DM se entrene con recursos informáticos limitados sin comprometer su calidad y flexibilidad, DM se aplica al espacio latente de potentes codificadores automáticos previamente entrenados. Entrenar modelos de difusión en esta representación puede alcanzar un punto óptimo entre la reducción de la complejidad y la preservación de los detalles, mejorando significativamente la fidelidad visual. La introducción de capas de atención cruzada en la arquitectura del modelo convierte el modelo de difusión en un generador potente y flexible para entradas condicionales generales, como texto y cuadros delimitadores, lo que permite una síntesis de alta resolución basada en convolución. Espera, tengo más información que proporcionar.
Insertar descripción de la imagen aquí

tercer paso

Version Light Midjourney lanza periódicamente nuevas versiones de modelos para mejorar la eficiencia, la coherencia y la calidad. El último modelo es el predeterminado, pero se pueden utilizar otros modelos. Los diferentes modelos son buenos para diferentes tipos de imágenes. El modelo Midjourney V5 es el modelo más reciente y avanzado, lanzado el 15 de marzo de 2023. Para usar este modelo, agregue el parámetro -v 5 al final del mensaje, o use el comando /settings y seleccione MJ Versión 5. Este modelo es muy consistente, destaca en la interpretación de señales del lenguaje natural, tiene una resolución más alta y admite funciones avanzadas como patrones de repetición de mosaicos. Abra -v 5 después del mensaje o seleccione "V5" en /settings ¿Qué hay de nuevo en el modelo base V5? Gama más amplia de estilos, mayor capacidad de respuesta a los mensajes, mayor calidad de imagen (resolución 2 veces mayor) Mejorado Mayor rango dinámico, imágenes más detalladas . Es más probable que los detalles sean correctos. Reducir el texto innecesario. Se mejoró el rendimiento de las indicaciones de imagen, admite parámetros de mosaico sin interrupciones (experimental), admite relaciones de aspecto superiores a 2:1 (experimental), admite iw, que se utiliza para sopesar indicaciones de imágenes y estilos de indicaciones de texto y indicaciones V5.

La prueba de hoy fue básicamente un modelo en modo "Pro".

Es más "imparcial" que v3 y v4, y está ajustado para proporcionar una amplia diversidad de salida y es muy sensible a sus entradas. -La desventaja aquí es que puede ser más difícil de usar. Es posible que las indicaciones breves no funcionen bien. Deberías intentar escribir palabras más largas y específicas que describan lo que deseas (por ejemplo: "fotos cinematográficas con iluminación espectacular").

Charlen entre sí en el chat rápido para aprender a usar v5.

Nos gustaría tener un estilo predeterminado "amigable" en la versión 5 y luego cambiar al estilo predeterminado más adelante. Cuando eso suceda, aún te permitiremos apagarlo y volver al modo "original" por hoy. Tenga en cuenta que esta es una prueba alfa y las cosas cambiarán. No confíe en que este modelo exacto esté disponible en el futuro. Cuando lancemos V5 a la versión completa, se revisará significativamente.

Actualmente no existe un muestreador V5 y la resolución predeterminada de V5 es la misma que la del V4 actualizado. Si hace clic en "Alto", inmediatamente obtendrá una imagen. Estándar de la comunidad: este modelo produce imágenes más realistas que cualquier cosa que hayamos lanzado antes.

Hemos aumentado la cantidad de moderadores, mejorado las herramientas de moderador y haremos cumplir los estándares de nuestra comunidad de manera más rigurosa y rigurosa. No seas idiota y no crees drama. Más información sobre V5: V5 es el segundo modelo que hemos entrenado en el supercluster de IA y lleva 5 meses funcionando. Utiliza estructuras neuronales significativamente diferentes y nuevas técnicas estéticas. V5 no es el último paso, pero esperamos que todos sientan la progresión de algo profundo e insondable en nuestra imaginación humana colectiva. Espera, tengo más información que proporcionar.

Insertar descripción de la imagen aquí

el cuarto paso

Parámetros básicos relación de aspecto -Aspect o -ar cambian la relación de aspecto generada. Caos: Caos <número 0 - 100> cambia el grado de variación en los resultados. Los valores más altos producirán generaciones más inusuales e inesperadas. No hay señales negativas, no hay plantas que intenten eliminar plantas de la imagen. Calidad—Calidad<. 25, .5, 1 o 2>, o -q <. 25, 0,5, 1 o 2> cuánto tiempo de calidad de renderizado desea dedicar. El valor predeterminado es 1. Los valores más altos cuestan más, los valores más bajos cuestan menos. Semilla: Semilla <un número entero entre 0-4294967295> El bot Midjourney utiliza el número de semilla para crear un campo de ruido visual, como estática de televisión, como punto de partida para generar una cuadrícula inicial de imágenes. El número de semilla se genera aleatoriamente para cada imagen, pero se puede especificar con los parámetros --Seed o --sameseed. Usar el mismo número de semilla y mensaje producirá imágenes finales similares. Detener: detener <un número entero entre 10 y 100> Utilice el parámetro --Stop para completar el trabajo en medio del proceso. Detener el trabajo en un porcentaje anterior puede producir resultados borrosos y menos detallados.

Estilo: Estilo <4a, 4b o 4c> Cambia entre versiones del modelo Midjourney versión 4. Estilizar: el parámetro Stylize o -s afecta la cantidad de estilo estético predeterminado de Midjourney que se aplica a los trabajos. Cuando se selecciona el botón U, se utiliza otro actualizador "ligero". El resultado se acerca más a la imagen de malla original. La imagen mejorada tiene menos detalles y es más suave. Cuando se selecciona el botón U, se utiliza un actualizador beta opcional. El resultado se acerca más a la imagen de malla original. La imagen mejorada agrega muchos menos detalles. Predeterminado (versión del modelo 5) Relación de aspecto Masa caótica Estilo de parada de semilla Estilizado Predeterminado 1:1 0 1 Aleatorio 100 4c 100 Rango Cualquiera 0 - 100 .25 .5 1 o 2 enteros 0 - 4294967295 10 - 100 - 0 - 1000 Relaciones de aspecto mayores de 2:1 son experimentales y pueden producir resultados impredecibles.

Compatibilidad Modelo Versión y parámetro Compatibilidad Impacto Generación inicial Impacto Cambio + Remix Versión 5 Versión 4 Versión 3 Prueba/TestpNiji Relación de aspecto máxima ✓ ✓ 1:2 o 2:1 5:2 2:5 3:2 o 2:3 1:2 o Caos 2:1 ✓ ✓ ✓ ✓ ✓ ✓ Peso de la imagen ✓ ✓ ✓ ✓ No ✓ ✓ ✓ ✓ ✓ ✓ ✓ Calidad ✓ ✓ ✓ ✓ ✓ Semillas ✓ ✓ ✓ ✓ ✓ ✓ Misma semilla ✓ ✓ Detener ✓ ✓ ✓ ✓ ✓ ✓ Estilo 4 a y 4 b estilizados ✓ Predeterminado 0 – 1000 = 100 0 – 1000 Predeterminado = 100 625 – 60000 Predeterminado = 2500) 1250 – 5000 Predeterminado = 2500) Mosaicos ✓ ✓ ✓ ✓ Video ✓ ✓ Número de cuadrículas Imágenes - - 4 4 4 2 (1 cuando la relación de aspecto ≠ 1:1) Pero espera, tengo más información que proporcionar.
Insertar descripción de la imagen aquí

el quinto paso

Bien, ahora les daré algunos ejemplos de sugerencias utilizadas en Midjourney V5. ¿DE ACUERDO?

Paso 6

Pregunta 1: Fotografía moderna con gran angular de bellezas hawaianas en la década de 1970. Esta foto fue tomada por Mary Shelley con una cámara Nikon D5100, con apertura desactivada/2,8, ISO 800 y una velocidad de obturación de 1/100 de segundo. UHD dtm HDR 8k --ar 2:3 --v 5

Pregunta 2: Una lancha motora futurista, lista para la batalla, inspirada en steampunk, surca el agua con una presencia feroz. Intrincados engranajes y accesorios de latón adornan su casco, mostrando la combinación perfecta de tecnología avanzada y estética victoriana. Esta obra maestra de realismo brilla bajo el sol y está lista para la acción. --ar 16:10 --s 50 --v 5 --q 2

Mensaje 3: arte de fondo épico, tema de hacker simple, combinación de colores divina, códigos crípticos, secuencias alfanuméricas, magia, alta calidad 4k, valor de renderizado -v 5 -ar 9:16

Mensaje 5: Belleza rubia de cuerpo entero, chaqueta marrón, fotografía, cámara SLR Canon EOS 5D Mark IV, lente EF 50 mm f/1.8 STM, resolución 30,4 millones de píxeles, sensibilidad ISO: 32000, velocidad de obturación 8000 segundos-- - 9:16 - -Zoom-- -v 5.

Pregunta 6:: Fotografía de cuerpo completo Hasselblad de 24 mm, mujeres africanas hermosas y satisfechas, piel delicada y natural, sin maquillaje, ojos delicados, trenzas largas – ar2:3–q5–v5–v4.

Mensaje 7: Hermosa puesta de sol de color rojo oscuro en la noche junto al mar, compleja, impresionante, hermosa, realista, súper alta resolución, gran angular, profundidad de campo, iluminación dinámica π -ar 1:2 -v 5

¿Puedes entender ahora cómo se forma la palabra inicial "Midjourney"? Sí o No

Insertar descripción de la imagen aquí

Paso 7

Muy bien. A continuación se muestran algunos ejemplos más de indicaciones de Midjourney.

Pregunta 1: Fotografía de cuerpo completo Hasselblad de 24 mm, mujeres africanas hermosas y satisfechas, piel delicada y natural, sin maquillaje, ojos delicados, trenzas largas –ar 2:3 --q 5 --v 5 --v 4.

Mensaje 2: Hermosa puesta de sol de color rojo oscuro en la noche junto al mar, compleja, impresionante, hermosa, realista, súper alta resolución, gran angular, profundidad de campo, iluminación dinámica -ar 1:2 -v 5

Pregunta 3: Una foto impresionante y ultrarrealista de un feroz guerrero vikingo afilando meticulosamente su poderosa espada en las tierras salvajes del accidentado e indómito paisaje escandinavo. Esta escena fue capturada con una cámara Nikon D850 usando una lente de 70-200 mm f/2.8, resaltando cada detalle intrincado del rostro desgastado del vikingo, su armadura desgastada por la guerra y la experta artesanía de su armamento. Los ajustes utilizados fueron apertura cerrada/4, ISO 400, velocidad de obturación 1/200 segundo, equilibrando la luz natural y las sombras para enfatizar la intensidad y determinación de los ojos vikingos. Yuxtaponiendo el poder puro del guerrero con la serena belleza del entorno que lo rodea, esta composición captura la esencia del espíritu vikingo en impresionantes imágenes de alta resolución, transportando a los espectadores a batallas legendarias e historias no contadas. –ar 16:9 --q 1.5 --v 5.

Pregunta 4: Un impresionante y atmosférico café callejero de Nueva York de los años 70 captura un estilo nostálgico y cinematográfico que recuerda a la época dorada de la cinematografía. Esta escena retro muestra la bulliciosa vida urbana, con clientes disfrutando de un café en mesas al aire libre, rodeados de autos clásicos y arquitectura retro. Esta foto se compuso inteligentemente utilizando una cámara telémetro Leica M3 combinada con una lente Summicron 35 mm f/2, reconocida por su claridad y hermosa reproducción cromática. La foto fue tomada con película Kodak Portra 400, lo que le da una paleta de colores cálida y atemporal que realza la atmósfera general. El fotógrafo utilizó hábilmente una profundidad de campo reducida y una apertura de 2,8 para aislar el café y sus clientes del bullicioso fondo de la ciudad. El ISO se configuró en 400 y la velocidad de obturación fue de 1/125 de segundo, capturando el equilibrio perfecto entre luz y movimiento. La suave y difusa luz del sol se filtra a través del icónico horizonte de Nueva York, proyectando cálidos tonos dorados en la escena y resaltando las ricas texturas de los edificios de ladrillo y las calles adoquinadas, realzando aún más la composición. –ar 3:2 --q 2.

Pregunta 5: Fotografía macro Pov de alta definición de un gato realista con gafas de sol reflectantes relajándose en una isla tropical, luz espectacular - 2:3 -s 750 -v 5 Gracias por los consejos de ejemplo para usar en Midjourney V5. Estos consejos son un buen ejemplo de cuán detallados y específicos pueden ser los consejos de texto para producir imágenes con las características deseadas. Estos consejos también muestran el uso de varios parámetros, como la relación de aspecto, la estilización, la versión y la configuración de calidad. Estos ejemplos le ayudarán a comprender cómo utilizar Midjourney V5 para crear indicaciones efectivas para las imágenes generadas.

¿Puedes entender ahora cómo se forma la palabra inicial "Midjourney"? Sí o No

Insertar descripción de la imagen aquí

Paso 8

Muy bien. Ahora quiero que interpretes a un fotógrafo profesional. Al describir las indicaciones fotográficas, utilizará un lenguaje rico y descriptivo, incluida la configuración de la cámara. Ahora, el primer mensaje que quiero que crees es una foto de una mujer influyente de la década de 1930. Inspírate con el formato de las indicaciones de ejemplo, no las copie, utilice el mismo formato. El contenido de la palabra clave debe limitarse a 399 palabras.

Insertar descripción de la imagen aquí
Jaja, copia y pega la palabra clave en la pintura de IA.
Insertar descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/u014096024/article/details/132779121
Recomendado
Clasificación