Young Knight [Fase 1 del evento fotográfico de difusión estable de InsCode]

Young Knight [Fase 1 del evento fotográfico de difusión estable de InsCode]


¿Has experimentado el explosivo mapa del amor?

¡Puedes crear tus propias obras como quieras sin la habilidad de pintar o fotografiar!

Pero muchas personas se desalientan debido al hardware costoso y la instalación engorrosa.

lnscode proporciona un entorno para aprender y usar Stable Diffusion, ha instalado software relacionado y bibliotecas de componentes, y puede iniciar directamente Stable Diffusion WebUI para la creación.

Dirección de uso en línea del modelo de difusión estable

1. Dirección en línea del modelo de difusión estable:

https://inscode.csdn.net/@inscode/Stable-Diffusion

primera foto

2. Versión del modelo y configuración relacionada:

Modelo: primemix_v21.safetensors [b79a4f7283]

Método de muestreo (Muestreador): DPM++ 2M Karras

Pasos de iteración de muestreo (pasos): 28

Ancho: 521

Altura: 768

Generar lotes (recuento de lotes): 1

Tamaño del lote: 1

Correlación de palabras rápidas (escala CFG): 7

3. Indicaciones de imágenes e indicaciones inversas:

Indicaciones positivas:

arte oficial, fondo de pantalla de Unity 8k, (alto detalle), hermoso y estético, obra maestra, mejor calidad, realista, mago, abanico emplumado, hechizo de viento, montaña, hanfu Iluminación delicada, reflejos suaves, profundidad discreta, <lora:JPKniji5 oc_v10:0.2 > lora:LowRA:0.8 lora:CAMERALora_v20:0.6 lora:JPKKKKKK3dCGStyleRealistic_v10:0.3 lora:xiaorenshu:0.35,lightonface,cinemalights,professionallighting,photonmapping,radiosity,.

Prueba de aviso inverso:

,alas,(Color monótono:1.2),bocetos, (peor calidad:2), (calidad baja:2), (calidad normal:2), baja resolución, calidad normal, ((monocromo)), ((escala de grises)), manchas en la piel, acné, imperfecciones en la piel, manchas de la edad, (al aire libre: 1.6), senos masculinos, contraluz, (feo: 1.331), (duplicado: 1.331), (mórbido: 1.21), (mutilado: 1.21), (transexual: 1.331) , manos mutadas, (manos mal dibujadas:1.331), borrosas, (mala anatomia:1.21), (malas proporciones:1.331), extremidades extra, (desfiguradas:1.331), (mas de 2 pezones:1.331), (brazos faltantes: 1.331), (piernas adicionales: 1.331), (dedos fusionados: 1.61051), (demasiados dedos: 1.61051), (ojos poco claros: 1.331), manos malas, dedos faltantes, (Cuatro dedos: 1.331), (seis dedos: 1.331) ),(mano extra:1.331), (pierna extra:1.4),dígito extra, (Pseudo Niang:1.1),(Ladyboy:1.4),mal cuerpo,(Marca de agua:1.4),(Una imagen incoherente:1.2),( Sin lógica: 1.331), (Menos pelo: 1.2), (Una imagen sombría: 1.1) ,NG_DeepNegative_V1_75T, glande, refracción, difusión, difracción, (peor calidad, baja calidad: 1.4)…

Semilla: 258369

inserte la descripción de la imagen aquí

segunda foto

Versión del modelo y configuración relacionada:

Modelo: primemix_v21.safetensors [b79a4f7283]

Método de muestreo (Muestreador): DPM++ 2M Karras

Pasos de iteración de muestreo (pasos): 35

Otros ajustes son los mismos que en la Figura 1

Indicaciones de imagen e indicaciones inversas:

正向提示词:(Cara clara),Detalles exquisitos,(Textura de ropa realista),Luz ambiental real, Textura de piel clara, Profundidad de campo, Dispersión, Halo, Filtro suave negro, Nikon D850, Punto de lente, VSCO, alta nivel. La mejor calidad, obra maestra, fotos, trabajos fotográficos, obras maestras, DHR, 8K, detalles complejos, alta resolución, RAW con gran detalle, papel tapiz, textura de película, real, (persona real), Xiake, un joven apuesto con una cola de caballo negra extremadamente larga y una marca de punto rojo entre las cejas. En el palacio de la noche oscura, lucha contra enemigos enmascarados en una postura de batalla, con la luz de una antorcha iluminando los copos de nieve que caen. La espada larga emite un tenue halo blanco plateado y, en las imágenes fijas de la película, todo el cuerpo.

反向提示词:marca de agua, pintura, dibujos animados, boceto, (peor calidad: 2), (baja calidad: 2), (calidad normal: 1), bajos, mala.anatomía, malas manos, ((monocromo)), ( (escala de grises)), feo, duplicado, mutilado, dedos adicionales, manos mutadas, manos mal dibujadas, mutación, mala anatomía, miembros adicionales, rostro clonado, desfigurado, proporciones brutas, miembros malformados, brazos faltantes, brazos adicionales, piernas adicionales , dedos fusionados, demasiados dedos, (pezones: 1.5), cara extraña,...

Semilla: 258371

inserte la descripción de la imagen aquí

tercera foto

Versión del modelo y configuración relacionada:

Modelo: primemix_v21.safetensors [b79a4f7283]

Método de muestreo (Muestreador): DPM++ 2M Karras

Pasos de iteración de muestreo (pasos): 35

Otros ajustes son los mismos que en la Figura 1

Indicaciones de imagen e indicaciones inversas:

正向提示词:(Cara clara),Detalles exquisitos,(Textura de ropa realista),Luz ambiental real, Textura de piel clara, Profundidad de campo, Dispersión, Halo, Filtro suave negro, Nikon D850, Punto de lente, VSCO, alta nivel. La mejor calidad, obra maestra, fotos, trabajos fotográficos, obras maestras, DHR, 8K, detalles complejos, alta resolución, RAW con gran detalle, papel tapiz, textura de película, real, (persona real), Xiake, un joven apuesto con una cola de caballo negra extremadamente larga y una marca de punto rojo entre las cejas. En el palacio de la noche oscura, lucha contra enemigos enmascarados en una postura de batalla, con la luz de una antorcha iluminando los copos de nieve que caen. La espada larga emite un tenue halo blanco plateado y, en las imágenes fijas de la película, todo el cuerpo.

反向提示词:marca de agua, pintura, dibujos animados, boceto, (peor calidad: 2), (baja calidad: 2), (calidad normal: 1), bajos, mala.anatomía, malas manos, ((monocromo)), ( (escala de grises)), feo, duplicado, mutilado, dedos adicionales, manos mutadas, manos mal dibujadas, mutación, mala anatomía, miembros adicionales, rostro clonado, desfigurado, proporciones brutas, miembros malformados, brazos faltantes, brazos adicionales, piernas adicionales , dedos fusionados, demasiados dedos, (pezones: 1.5), cara extraña,...

Semilla: 258371

inserte la descripción de la imagen aquí

cuarta foto

Versión del modelo y configuración relacionada:

Modelo: primemix_v21.safetensors [b79a4f7283]

Método de muestreo (Muestreador): DPM++ 2M Karras

Pasos de iteración de muestreo (pasos): 35

Otros ajustes son los mismos que en la Figura 1

Indicaciones de imagen e indicaciones inversas:

正向提示词:(8k, foto RAW, mejor calidad, obra maestra: 1.2), (realista, fotorrealista: 1.37), (feiwangzi, 1 niño), mosca, edificio, castillo, ciudad, paisaje urbano, nube, cielo_nublado, de pie ,

反向提示词:(EasyNegative:1.2), ng_deepnegative_v1_75t, pinturas, bocetos, (peor calidad:2), (baja calidad:2), (normal calidad:2), baja resolución, calidad normal, ((monocromo)), ( (escala de grises)), mala anatomía, (pelo largo: 1,4), DeepNegative, (grasa: 1,2), mirando hacia otro lado, mirando hacia otro lado, cabeza inclinada, baja resolución, mala anatomía, malas manos, texto, error, dedos faltantes, dígito adicional, menos dígitos, recortado, peor calidad, baja calidad, calidad normal, jpegartifacts, firma, marca de agua, nombre de usuario, borroso, pies defectuosos, recortado, manos mal dibujadas, cara mal dibujada, mutación, deformado, peor calidad, baja calidad, calidad normal, artefactos jpeg, firma, marca de agua, dedos adicionales, menos dígitos, miembros adicionales, brazos adicionales, piernas adicionales, miembros malformados, dedos fusionados, demasiados dedos, cuello largo, bizcos, manos mutadas, baja resolución polar, mal cuerpo, malas proporciones ,proporciones brutas,texto,error,dedos que faltan,brazos que faltan,faltan piernas,digi extra

Semilla: 258373

inserte la descripción de la imagen aquí

quinta foto

Versión del modelo y configuración relacionada:

Modelo: primemix_v21.safetensors [b79a4f7283]

Método de muestreo (Muestreador): DPM++ 2M Karras

Pasos de iteración de muestreo (pasos): 35

Otros ajustes son los mismos que en la Figura 1

Indicaciones de imagen e indicaciones inversas:

正向提示词:(8k, foto RAW, mejor calidad, obra maestra: 1.2), (realista, fotorrealista: 1.37), (3Drender, octane render), kai, 1 niño, solo, (parte superior del cuerpo, noche, de pie, 40 años)

反向提示词:(EasyNegative:1.2), ng_deepnegative_v1_75t, pinturas, bocetos, (peor calidad:2), (baja calidad:2), (normal calidad:2), baja resolución, calidad normal, ((monocromo)), ( (escala de grises)), mala anatomía, (pelo largo: 1,4), DeepNegative, (grasa: 1,2), mirando hacia otro lado, mirando hacia otro lado, cabeza inclinada, baja resolución, mala anatomía, malas manos, texto, error, dedos faltantes, dígito adicional, menos dígitos, recortado, peor calidad, baja calidad, calidad normal, jpegartifacts, firma, marca de agua, nombre de usuario, borroso, pies defectuosos, recortado, manos mal dibujadas, cara mal dibujada, mutación, deformado, peor calidad, baja calidad, calidad normal, artefactos jpeg, firma, marca de agua, dedos adicionales, menos dígitos, miembros adicionales, brazos adicionales, piernas adicionales, miembros malformados, dedos fusionados, demasiados dedos, cuello largo, bizcos, manos mutadas, baja resolución polar, mal cuerpo, malas proporciones ,proporciones brutas,texto,error,dedos que faltan,brazos que faltan,faltan piernas,digi extra,((sosteniendo_arma,sosteniendo,arma,espada))

Semilla: 258376

inserte la descripción de la imagen aquí

Capítulo 6 Figura

Versión del modelo y configuración relacionada:

modelo: chilloutmix-Ni.safetensors[7234b76e42]

Método de muestreo (Muestreador): DPM++ 2M Karras

Pasos de iteración de muestreo (pasos): 50

Otros ajustes son los mismos que en la Figura 1

Indicaciones de imagen e indicaciones inversas:

正向提示词:Obra maestra, 1 niña, primer plano, usar hanfu azul, tela tradicional china, ((sosteniendo una espada de agua)) cabello largo y negro, trenza, fondo de onda azul, efecto de agua, estilo de pintura con tinta, pose dinámica, pose de batalla

Palabras de sugerencia inversa: EasyNegativeV2, ng_deepnegative_v1_75t, (baja_calidad: 1.4), (peor_calidad: 1.4), (badhandv4: 1.1), collage, nombre_artista, firma, logo_artista, marca de agua

Semilla: 258370

inserte la descripción de la imagen aquí

1. Experiencia de difusión estable de InsCode

1.1 La interfaz es muy amigable

Siga las indicaciones para iniciar el entorno.

inserte la descripción de la imagen aquí

1.2 Un poco de experiencia

Stable Diffusion WebUIinterfaz abierta

inserte la descripción de la imagen aquí

Ingrese las palabras positivas al comienzo del artículo, las palabras inversas y otros parámetros se configuran como se muestra en la figura a continuación para generar bellas imágenes.

inserte la descripción de la imagen aquí

1.3 Experiencia

La velocidad de generación es muy rápida jaja, 老年机mucho más rápido que generar imágenes localmente

2. Cómo instalar Lora para Difusión Estable en InsCode

Los pasos se refieren a Cómo instalar Lora para difusión estable en InsCode

3. Base de sintonización de difusión estable

3.1 Selección de modelo

Los conjuntos de datos y las etiquetas utilizadas por el modelo son muy importantes para el impacto del efecto. Antes de usarlo, primero debe comprender la fuente de datos.

3.2 Modelo de difusión estable

Los modelos de difusión estable son adecuados para generar imágenes similares a fotografías y obras de arte. Entrenamiento basado en el conjunto de datos LAION .

3.3 Introducción a los parámetros comunes

  • Aviso: una descripción textual de lo que desea generar.
  • Indicación negativa: describe con palabras lo que no quieres en la imagen.
  • Pasos de muestreo: los modelos de difusión funcionan tomando pequeños pasos desde el ruido gaussiano aleatorio hasta una imagen que coincide con una señal. ¿Cuántos pasos de este tipo debería haber? Más pasos significa pasos más pequeños y precisos del ruido a la imagen. Aumentar esto aumenta directamente el tiempo que lleva generar la imagen. Rendimientos decrecientes, según el muestreador.
  • Método de muestreo: qué muestreador utilizar. Euler a (abreviatura de ancestral) produce mucha diversidad con una pequeña cantidad de pasos, pero dificulta los pequeños ajustes. Todos los samplers no ancestrales producen esencialmente la misma imagen a medida que aumenta el número de pasos, use LMS si no está seguro.
  • Batch count/n_iter: el número de grupos de imágenes generados cada vez. El número de imágenes generadas en una ejecución es Recuento de lotes * Tamaño de lote.
  • Tamaño del lote: cuántas imágenes se generan al mismo tiempo. Aumentar este valor mejora el rendimiento, pero también necesita más VRAM. El número total de imágenes es este valor multiplicado por el número de lotes. Por lo general, permanezca en 1, excepto para tarjetas avanzadas como 4090.
  • Escala CFG (escala de orientación libre de categorías): qué tan bien la imagen coincide con su señal. Aumentar este valor dará como resultado una imagen más cercana a su señal (según el modelo), pero también reduce un poco la calidad de la imagen. Se puede compensar con más pasos de muestreo.
  • Ancho: el ancho de la imagen, en píxeles. Para aumentar este valor, necesita más memoria de video. La consistencia de la imagen a gran escala empeora a medida que aumenta la resolución (el modelo se entrena en 512x512). Valores muy pequeños (como 256 píxeles) también reducen la calidad de la imagen. Este valor debe ser múltiplo de 8.
  • Altura: Altura de la imagen.
  • Semilla: El punto de partida del número aleatorio. Mantener este valor constante puede generar la misma imagen (o casi la misma, si xformers está habilitado) varias veces. Ninguna semilla es intrínsecamente mejor que otra, pero una semilla que previamente produjo buenos resultados probablemente seguirá produciendo buenos resultados si varía sus parámetros de entrada solo levemente.

3.4 Pasos de muestreo pasos de iteración

Más iteraciones pueden dar como resultado mejores resultados, más detalles y nitidez, pero darán como resultado tiempos de generación más largos. En la práctica, la diferencia entre 30 pasos y 50 pasos es casi indistinguible.

Demasiadas iteraciones también pueden ser contraproducentes y proporcionar pocas mejoras.

Al realizar la generación de imágenes, en circunstancias normales, una fuerza de reducción de ruido más débil requiere menos iteraciones (esto está determinado por el principio de funcionamiento). Puede cambiar la configuración en la configuración para que el programa ejecute exactamente el número de iteraciones especificadas por el control deslizante.

3.5 Muestreadores Muestreador

En la actualidad, es fácil de usar Euler, Euler a(más delicado), y DDIM.

Recomendado Euler ay DDIMrecomendado para principiantesEuler a

Euler aSea creativo, diferentes números de pasos pueden producir diferentes imágenes. Aumentar demasiado el número de pasos (>30) no funcionará mejor.

DDIMConvergencia rápida, pero eficiencia relativamente baja, porque se requieren muchos pasos para obtener buenos resultados, adecuados para redibujar

LMSy PLMSson Eulerderivados de , que usan un enfoque relacionado pero ligeramente diferente (promediando los últimos pasos para mejorar la precisión). Alrededor de 30 pasos pueden obtener resultados estables

PLMSes un LMS efectivo (método clásico) que puede manejar mejor las singularidades en las estructuras de redes neuronales

DPM2es un método asombroso, su objetivo es mejorar DDIM con menos pasos para obtener buenos resultados. Necesita ejecutar la eliminación de ruido dos veces por paso, que es aproximadamente el doble de rápido que DDIM. Pero si está experimentando con la depuración de palabras indicadoras, esta muestra no funciona muy bien.

Euleres el más simple y por lo tanto uno de los más rápidos

3.6 Correlación de palabras de indicación de la escala CFG

cfg scalees el grado de ajuste entre la imagen y la palabra indicadora, cuanto mayor sea el valor, mayor será la influencia de la palabra indicadora en el resultado final generado y mayor será el grado de ajuste.

Una escala CFG demasiado alta se manifiesta en líneas duras e imágenes demasiado nítidas.

3.7 Presta atención al tamaño

Cuando el tamaño de la trama es demasiado amplio, pueden aparecer múltiples sujetos en la trama.

Para hacer coincidir la postura, la cámara y los personajes no se deforman, a veces se necesitan calificativos, cuando hay muchos personajes se debe tratar la relación espacial y la prioridad de oclusión puntual. Número de personas->Apariencia del personaje->Estilo del entorno->Estado del personaje

¡Las dimensiones superiores a 1024 pueden dar resultados no deseados! Se recomienda una solución pequeña de resolución + HD (descrita a continuación).

3.8 Reparación HD de alta resolución

Habilitado marcando la casilla de verificación "Highres.fix" en la página txt2img (figura de Vincent).

Por defecto, txt2img (gráfico de Vinson) produce imágenes muy caóticas a altas resoluciones. Esta opción hará que el modelo genere primero una imagen pequeña y luego amplíe la resolución de la imagen a través de img2img para lograr un efecto de imagen grande de alta definición.

3.9 Recuento de lotes 与 Tamaño del lote

  • Batch Count(生成批次)Especifica cuántos lotes generar en total.
  • Batch Size(每批数量)Especifica cuántas imágenes se producen en paralelo por lote.

Un tamaño de lote grande necesita consumir una gran cantidad de memoria de video. Si su tarjeta gráfica no tiene más de 12 G de memoria de video, no ajuste el tamaño del lote.

Para una tarjeta gráfica con una gran memoria de video, generar una imagen a la vez no puede utilizar completamente la capacidad de cómputo de la tarjeta gráfica. En este momento, puede Batch Sizeaumentar para exprimir completamente la potencia de cómputo.

3.10 Semilla aleatoria

En teoría, la semilla determina toda la aleatoriedad involucrada en la generación de imágenes del modelo.

El valor real de la semilla no es importante. Simplemente se inicializa con un valor inicial aleatorio que define el punto de partida de la difusión.

Con exactamente los mismos parámetros aplicados (por ejemplo, Paso, CFG, Semilla, indicaciones), las imágenes resultantes deberían ser idénticas. (sin usar xformersoptimizadores de interferencia como )

Diferentes tarjetas gráficas pueden tener diferentes resultados inesperados debido a sus diferentes microarquitecturas. Reflejado principalmente en las tarjetas gráficas de la serie GTX 10xx.

3.11 Fuerza de eliminación de ruido Fuerza de reducción de ruido

Denoising strengthSolo se aplica cuando img2img (imagen generada por imagen) o restauración de alta definición, que representa el grado de cambio de la imagen generada final al contenido de la imagen de entrada original. Al ajustar este valor, puede reducir el impacto en el estilo de pintura, pero también debilitará la capacidad de img2img. Cuanto mayor sea el valor, menor será el grado de referencia de AI a la imagen original (al tiempo que aumenta el número de iteraciones).

Para imágenes generadas por imágenes, bajo denoisingsignifica corregir la imagen original y alto denoisingsignifica que no hay una gran correlación con la imagen original. En términos generales, el umbral está en torno a 0,7, si supera 0,7 no tiene nada que ver con la imagen original, y si está por debajo de 0,3 se modificará ligeramente.

En la ejecución real, los pasos de ejecución específicos son Fuerza de eliminación de ruido * Pasos de muestreo.

Contenido del próximo capítulo: Cómo escribir instrucciones para generar texto a partir de imágenes


Nuggets de lanzamiento fuera del sitio
: https://juejin.cn/post/7256302444387795005 51CTO: https://blog.51cto.com/u_15067771/6741182
Comunidad de desarrolladores de Alipay: https://open.alipay.com/portal/forum / post/131301015
Comunidad Aliyun: https://developer.aliyun.com/article/1276080
comunidad de información: https://xie.infoq.cn/article/d88497eb5644c10ea3dc82b47

Supongo que te gusta

Origin blog.csdn.net/u014096024/article/details/131756743
Recomendado
Clasificación