Hola a todos, soy lluvia o sol.
A través de la introducción de la anterior serie de investigación Stable Diffusion de pintura AI, hemos completado la instalación del paquete de integración Stable Diffusion, la instalación del modelo ControlNet1.1 y la introducción e instalación de los tipos de modelos. lea los tutoriales ya tenga prácticas operativas Entorno de difusión estable.
Luego, este artículo le brindará una introducción a la función de gráfico de Vincent más importante y más utilizada de Stable Diffusion. Debido a la gran cantidad de contenido, se dividirá en dos artículos para la introducción.
Lo que les traigo hoy es AI Painting Stable Diffusion Research (4) Explicación detallada de la función del diagrama sd Wensheng (Parte 1).
Después de ingresar a la página de interfaz de usuario web, lo primero que verá es la siguiente interfaz.
La figura anterior muestra claramente las funciones generales de la interfaz del diagrama de Vincent.
A continuación, explicaremos en detalle cómo usar cada función y precauciones.
1. Área de selección de modelo
Los modelos son muy importantes para el dibujo SD. Los diferentes tipos de modelos y la calidad determinarán en gran medida el efecto final del dibujo.
2. Barra de funciones
Incluye funciones comunes como gráfico de Vincent común, gráfico generado por gráfico y posprocesamiento. Las diferentes páginas de funciones también son diferentes Aquí, primero explicaremos las páginas del módulo de diagrama de Vincent que se usan con frecuencia.
3. Indicaciones positivas
Indicación de palabra de indicación positiva &etiqueta**: si ha utilizado ChatGPT, debe saber qué es la indicación. Para decirlo sin rodeos, queremos la descripción de qué tipo de imágenes queremos que SD ayude a generar, como personajes o escenas, etc. **Es necesario usar inglés para la descripción
Etiquetas para Prompt & Tag para mejorar la calidad de la imagen:
masterpiece, best quality
4. Indicaciones inversas
Palabra de solicitud inversa Prompt&Tag: es para decirle a SD que genere la imagen, y el contenido que no quiere aparecer debe describirse en inglés .
El reverso de la etiqueta universal garantiza que no habrá etiquetas utilizadas por los dioses antiguos:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
5. Botón Generar
Después de ajustar otras configuraciones, haga clic en Generar para comenzar a generar la imagen, o puede dejarla en paz.
6. Pasos de iteración de muestreo
El proceso de pintura AI es un proceso de convertir una imagen de ruido puro en una imagen de alta definición. El número de pasos de iteración de muestreo es el número de pasos necesarios para este proceso. A medida que aumenta el número de pasos, los detalles de la imagen también aumentar.
El número de pasos de iteración de muestreo no puede establecerse demasiado pequeño ni demasiado grande. Si la configuración es demasiado pequeña, el efecto de la imagen no será bueno; si la configuración es demasiado grande, se tardará más en generar la imagen. Si supera los 40 pasos, el cambio de la imagen es básicamente invisible.
Se recomienda que el número de pasos de iteración de muestreo esté entre 20 y 30, generalmente 28 es un buen valor.
7. Método de muestreo
Qué tipo de algoritmo de dibujo y "cuántos trazos para dibujar" se utilizan para dibujar, hasta cierto punto determinan la calidad del dibujo.
El siguiente es cada método de muestreo, correspondiente al efecto del número de pasos de generación.
Como se muestra en la imagen:
Según las referencias anteriores, de acuerdo con la comparación de la calidad de la imagen y los pasos de muestreo, se recomienda que los principiantes utilicen: Método de muestreo adaptativo DPM .
8. Área de visualización de gráficos
9. Tamaño de la imagen de salida
Tamaño de la imagen de salida: predeterminado 512**512 píxeles, porque este tamaño se usa durante el entrenamiento del modelo, por lo que el efecto es el mejor, por lo general, mantenga el valor predeterminado, por supuesto, si desea generar una imagen 3: 2, también puede configúrelo en: 512 * 768, 768 * 512.
Ajuste según sus necesidades, o no necesita ajustar. Cuanto mayor sea la imagen de salida, mayores serán los requisitos para la tarjeta gráfica.
10. Número de dibujos
Número de parcelas = número total de lotes x número de cada lote.
Cuanto mayor sea el número de cada lote: mayor será la memoria de video requerida.
Más lotes totales: como regla general, la calidad de la imagen resultante es mejor, pero lleva más tiempo.
Puede elegir según sus necesidades y la configuración del equipo.
11. Directorio de almacenamiento de exportación
Puedes encontrar tramas históricas
12. Semilla aleatoria
Imitar las imágenes de otras personas requiere ajustes y, por lo general, no se requieren ajustes.
13. Reparación facial
Para la reparación de la cara, primero debe establecer la configuración de acuerdo con las siguientes opciones:
Luego haga clic en: Guardar configuración, recargar la interfaz y dejar que surta efecto:
14 Reparación de alta resolución
Debido a que nuestra imagen de salida es 512 * 512, si desea acercar, como 1024x1024, debe verificar la función de restauración de alta resolución.
A. Recomendación de selección del algoritmo de amplificación
Opción recomendada de estilo real: R-ESRGAN 4x+
Recomendación de estilo anime: R-ESRGAN 4x+ Anim
B. Ampliación
Elija según la configuración de la computadora
Selección alta de memoria de tarjeta gráfica 2-3 veces
La memoria de video de la tarjeta gráfica no es alta, elija 1.5-2 veces
15. Coeficiente de guía de palabras rápidas (escala CFD):
El coeficiente de orientación de la palabra indicadora es para controlar la correlación entre la palabra indicadora y la imagen generada. Puede entenderse como "cuanto más pequeña es la IA, más libre es para jugar". Generalmente, el valor recomendado es entre 5 y 15, y el valor predeterminado es 7.
Si el valor es demasiado grande, aparecerá el efecto de nitidez y líneas más gruesas;
Si es demasiado pequeño, la IA jugará libremente sin mirar la etiqueta y, al mismo tiempo, la saturación de la imagen será baja.
Consulte el cuadro de comparación a continuación:
16. Semilla aleatoria:
La semilla aleatoria es la fuente de toda aleatoriedad en el proceso de generación, y cada semilla es una pintura diferente.
El valor predeterminado -1 significa cambiar una semilla aleatoria cada vez, y cada imagen generada es diferente. A partir de la semilla aleatoria, se genera un mapa de ruido aleatorio y luego se entrega a la IA para que lo dibuje.
Con una semilla aleatoria fija, el gráfico generado se puede controlar para que sea más similar al gráfico anterior.
17, guardar
Para el despliegue local, no tiene mucho sentido.
Si está destinado a implementarse en el servidor, haga clic en Guardar para descargarlo.
18. Descarga del paquete
Al generar varias imágenes, las imágenes se empaquetarán en un paquete comprimido y se pueden descargar, lo que básicamente no se usa localmente.
19. Las tres funciones de envío a generación de imagen, envío a redibujado y envío a posprocesamiento no se introducirán aquí. Lo explicaré en detalle más adelante cuando presente la función de crear una imagen.
20. Introducción a la función de iconos
Icono 1: la flecha lee los parámetros de generación de la palabra de solicitud o la imagen generada la última vez.
Icono 2: Borrar palabras de aviso
Icono 3: mostrar y ocultar rápidamente modelos extendidos
Icono 4: estilo preestablecido, guarde las palabras de solicitud inversas.
21. Una breve descripción del uso de ponderación de etiquetas y reducción de peso
¿A menudo puede ver algunos símbolos en las etiquetas publicadas por otros? Como paréntesis, etc. Estos son usos avanzados, que solo se mencionan brevemente aquí.
Aquí tomamos el árbol de etiquetas como ejemplo para la ilustración.
(Árbol): Ponderado, esto es 1,1 veces.
((Tree)) : Corchetes superpuestos, que es 1,1*1,1=1,21 veces.
[Árbol]: reduce el peso, generalmente se usa menos. La reducción de peso generalmente usa el múltiplo especificado a continuación.
(Árbol: 1,5) especifica el múltiplo, aquí hay un peso de 1,5 veces, y (Árbol: 0,9) también puede lograr el efecto de reducción de peso.
Bueno, eso es todo por el contenido de hoy. El próximo artículo explicará en detalle las reglas y las habilidades de escritura de las palabras rápidas, ¡así que estad atentos!