Investigación de difusión estable de pintura AI (4) Explicación detallada de la función de mapa sd Vincent (Parte 1)


Hola a todos, soy lluvia o sol.


A través de la introducción de la anterior serie de investigación Stable Diffusion de pintura AI, hemos completado la instalación del paquete de integración Stable Diffusion, la instalación del modelo ControlNet1.1 y la introducción e instalación de los tipos de modelos. lea los tutoriales ya tenga prácticas operativas Entorno de difusión estable.


Luego, este artículo le brindará una introducción a la función de gráfico de Vincent más importante y más utilizada de Stable Diffusion. Debido a la gran cantidad de contenido, se dividirá en dos artículos para la introducción.


Lo que les traigo hoy es AI Painting Stable Diffusion Research (4) Explicación detallada de la función del diagrama sd Wensheng (Parte 1).


Después de ingresar a la página de interfaz de usuario web, lo primero que verá es la siguiente interfaz.


inserte la descripción de la imagen aquí

La figura anterior muestra claramente las funciones generales de la interfaz del diagrama de Vincent.
A continuación, explicaremos en detalle cómo usar cada función y precauciones.


1. Área de selección de modelo

Los modelos son muy importantes para el dibujo SD. Los diferentes tipos de modelos y la calidad determinarán en gran medida el efecto final del dibujo.


2. Barra de funciones

Incluye funciones comunes como gráfico de Vincent común, gráfico generado por gráfico y posprocesamiento. Las diferentes páginas de funciones también son diferentes Aquí, primero explicaremos las páginas del módulo de diagrama de Vincent que se usan con frecuencia.


3. Indicaciones positivas

Indicación de palabra de indicación positiva &etiqueta**: si ha utilizado ChatGPT, debe saber qué es la indicación. Para decirlo sin rodeos, queremos la descripción de qué tipo de imágenes queremos que SD ayude a generar, como personajes o escenas, etc. **Es necesario usar inglés para la descripción


Etiquetas para Prompt & Tag para mejorar la calidad de la imagen:

masterpiece, best quality

4. Indicaciones inversas

Palabra de solicitud inversa Prompt&Tag: es para decirle a SD que genere la imagen, y el contenido que no quiere aparecer debe describirse en inglés .


El reverso de la etiqueta universal garantiza que no habrá etiquetas utilizadas por los dioses antiguos:

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

5. Botón Generar

Después de ajustar otras configuraciones, haga clic en Generar para comenzar a generar la imagen, o puede dejarla en paz.


6. Pasos de iteración de muestreo

El proceso de pintura AI es un proceso de convertir una imagen de ruido puro en una imagen de alta definición. El número de pasos de iteración de muestreo es el número de pasos necesarios para este proceso. A medida que aumenta el número de pasos, los detalles de la imagen también aumentar.


El número de pasos de iteración de muestreo no puede establecerse demasiado pequeño ni demasiado grande. Si la configuración es demasiado pequeña, el efecto de la imagen no será bueno; si la configuración es demasiado grande, se tardará más en generar la imagen. Si supera los 40 pasos, el cambio de la imagen es básicamente invisible.


Se recomienda que el número de pasos de iteración de muestreo esté entre 20 y 30, generalmente 28 es un buen valor.


7. Método de muestreo

Qué tipo de algoritmo de dibujo y "cuántos trazos para dibujar" se utilizan para dibujar, hasta cierto punto determinan la calidad del dibujo.

El siguiente es cada método de muestreo, correspondiente al efecto del número de pasos de generación.


Como se muestra en la imagen:

inserte la descripción de la imagen aquí


inserte la descripción de la imagen aquí


inserte la descripción de la imagen aquí


inserte la descripción de la imagen aquí


Según las referencias anteriores, de acuerdo con la comparación de la calidad de la imagen y los pasos de muestreo, se recomienda que los principiantes utilicen: Método de muestreo adaptativo DPM .


8. Área de visualización de gráficos

9. Tamaño de la imagen de salida

Tamaño de la imagen de salida: predeterminado 512**512 píxeles, porque este tamaño se usa durante el entrenamiento del modelo, por lo que el efecto es el mejor, por lo general, mantenga el valor predeterminado, por supuesto, si desea generar una imagen 3: 2, también puede configúrelo en: 512 * 768, 768 * 512.

Ajuste según sus necesidades, o no necesita ajustar. Cuanto mayor sea la imagen de salida, mayores serán los requisitos para la tarjeta gráfica.


10. Número de dibujos

Número de parcelas = número total de lotes x número de cada lote.

Cuanto mayor sea el número de cada lote: mayor será la memoria de video requerida.

Más lotes totales: como regla general, la calidad de la imagen resultante es mejor, pero lleva más tiempo.

Puede elegir según sus necesidades y la configuración del equipo.


11. Directorio de almacenamiento de exportación

Puedes encontrar tramas históricas


12. Semilla aleatoria

Imitar las imágenes de otras personas requiere ajustes y, por lo general, no se requieren ajustes.


13. Reparación facial

Para la reparación de la cara, primero debe establecer la configuración de acuerdo con las siguientes opciones:


inserte la descripción de la imagen aquí


Luego haga clic en: Guardar configuración, recargar la interfaz y dejar que surta efecto:

inserte la descripción de la imagen aquí


14 Reparación de alta resolución

Debido a que nuestra imagen de salida es 512 * 512, si desea acercar, como 1024x1024, debe verificar la función de restauración de alta resolución.


A. Recomendación de selección del algoritmo de amplificación

Opción recomendada de estilo real: R-ESRGAN 4x+

inserte la descripción de la imagen aquí


Recomendación de estilo anime: R-ESRGAN 4x+ Anim

inserte la descripción de la imagen aquí


B. Ampliación

Elija según la configuración de la computadora

Selección alta de memoria de tarjeta gráfica 2-3 veces

La memoria de video de la tarjeta gráfica no es alta, elija 1.5-2 veces


15. Coeficiente de guía de palabras rápidas (escala CFD):

El coeficiente de orientación de la palabra indicadora es para controlar la correlación entre la palabra indicadora y la imagen generada. Puede entenderse como "cuanto más pequeña es la IA, más libre es para jugar". Generalmente, el valor recomendado es entre 5 y 15, y el valor predeterminado es 7.

Si el valor es demasiado grande, aparecerá el efecto de nitidez y líneas más gruesas;

Si es demasiado pequeño, la IA jugará libremente sin mirar la etiqueta y, al mismo tiempo, la saturación de la imagen será baja.


Consulte el cuadro de comparación a continuación:

inserte la descripción de la imagen aquí


inserte la descripción de la imagen aquí


16. Semilla aleatoria:

La semilla aleatoria es la fuente de toda aleatoriedad en el proceso de generación, y cada semilla es una pintura diferente.

El valor predeterminado -1 significa cambiar una semilla aleatoria cada vez, y cada imagen generada es diferente. A partir de la semilla aleatoria, se genera un mapa de ruido aleatorio y luego se entrega a la IA para que lo dibuje.

Con una semilla aleatoria fija, el gráfico generado se puede controlar para que sea más similar al gráfico anterior.


17, guardar

Para el despliegue local, no tiene mucho sentido.

Si está destinado a implementarse en el servidor, haga clic en Guardar para descargarlo.


18. Descarga del paquete

Al generar varias imágenes, las imágenes se empaquetarán en un paquete comprimido y se pueden descargar, lo que básicamente no se usa localmente.

inserte la descripción de la imagen aquí


19. Las tres funciones de envío a generación de imagen, envío a redibujado y envío a posprocesamiento no se introducirán aquí. Lo explicaré en detalle más adelante cuando presente la función de crear una imagen.


20. Introducción a la función de iconos

inserte la descripción de la imagen aquí


Icono 1: la flecha lee los parámetros de generación de la palabra de solicitud o la imagen generada la última vez.

Icono 2: Borrar palabras de aviso

Icono 3: mostrar y ocultar rápidamente modelos extendidos

Icono 4: estilo preestablecido, guarde las palabras de solicitud inversas.


21. Una breve descripción del uso de ponderación de etiquetas y reducción de peso

¿A menudo puede ver algunos símbolos en las etiquetas publicadas por otros? Como paréntesis, etc. Estos son usos avanzados, que solo se mencionan brevemente aquí.

Aquí tomamos el árbol de etiquetas como ejemplo para la ilustración.

(Árbol): Ponderado, esto es 1,1 veces.

((Tree)) : Corchetes superpuestos, que es 1,1*1,1=1,21 veces.

[Árbol]: reduce el peso, generalmente se usa menos. La reducción de peso generalmente usa el múltiplo especificado a continuación.

(Árbol: 1,5) especifica el múltiplo, aquí hay un peso de 1,5 veces, y (Árbol: 0,9) también puede lograr el efecto de reducción de peso.


Bueno, eso es todo por el contenido de hoy. El próximo artículo explicará en detalle las reglas y las habilidades de escritura de las palabras rápidas, ¡así que estad atentos!


Supongo que te gusta

Origin blog.csdn.net/lizhong2008/article/details/132053289
Recomendado
Clasificación