Escenario de aplicación Práctica de IA generativa en la industria del comercio electrónico: habilitación de la producción eficiente de materiales de marketing

f9052c517b7d88832393abed03cc475e.gif

Gracias por leer la serie de blogs "Guía de soluciones de la industria de IA generativa". La serie completa se divide en 4 artículos. Presentará sistemáticamente la guía de soluciones de IA generativa y sus escenarios típicos en las industrias de comercio electrónico, juegos y pan-entretenimiento. práctica de aplicación. El directorio es el siguiente:

  • Parte 1 "Guía de solución y guía de implementación de la industria de IA generativa"

  • La segunda parte de "La práctica del escenario de aplicación de la IA generativa en la industria del comercio electrónico: permitir la producción eficiente de materiales de marketing" (esta parte)

  • El tercer artículo "Escenarios de aplicación de la IA generativa en la industria de los juegos: aceleración de la producción de contenido artístico para juegos" (próximamente)

  • El cuarto artículo "Escenarios de aplicación de IA generativa en la industria del pan-entretenimiento: facilitación de la creación de contenido de video estilizado" (próximamente)

introducción de fondo

AI Generated Content (IA generativa, la inteligencia artificial genera contenido automáticamente), es un nuevo método de creación de contenido después del contenido de producción profesional (PGC, Professional-generated Content) y el contenido generado por el usuario (UGC, User-generated Content). , iteración, difusión, personalización, etc., dan rienda suelta a las ventajas técnicas para crear una nueva forma de generación e interacción de contenidos digitales. Con el desarrollo de la tecnología, la IA generativa se ha utilizado ampliamente en muchas industrias, como el mapa de estilo de la industria del pan-entretenimiento y la vista de tres de la industria de los juegos. Este artículo se centrará en los escenarios de aplicación de la IA generativa en la industria del comercio electrónico.

Los costos de marketing a menudo ocupan una gran proporción del gasto anual total de la industria del comercio electrónico, y los efectos de marketing también afectan las ventas y las ventas hasta cierto punto. El marketing de comercio electrónico incluye marketing por SMS, marketing por correo electrónico, publicidad, etc. Hoy en día, la transmisión en vivo y la entrega de videos cortos se han convertido en importantes canales de marketing en la industria del comercio electrónico. El método de marketing de celebridades de KOL puede generar más visitas a los productos promocionados a través del efecto de abanico. Sin embargo, el costo de la promoción de KOL es relativamente alto y, para los productos que se venden en todo el mundo, el costo de la promoción aumentará exponencialmente en escenarios multilingües, multihorarios y multiestéticos. Al mismo tiempo, en la experiencia del usuario y los productos básicos cada vez más homogéneos de hoy en día, cómo mejorar la experiencia del usuario, lograr la diferenciación y aumentar la retención de usuarios también es un tema clave en la búsqueda de avances en el campo del comercio electrónico.

En términos de publicidad, para el comercio electrónico transfronterizo que enfrentan usuarios multinacionales, a menudo es necesario contratar modelos multinacionales para llevar a cabo imágenes y planes de marketing específicos para diferentes países, tomarlos por separado y presentarlos después de la publicación. edición, lo que hace que los materiales de marketing generados lleguen a todos El costo es más alto y el tiempo es más largo. Además de las consideraciones de marketing anteriores, en lo que respecta al diseño, el diseño de productos, como el diseño de ropa de mujer, el diseño de empaques de productos, etc., también tiene un gran impacto en las ventas de productos. Para los diseñadores, el tiempo y la energía necesarios para diseñar un producto desde la inspiración hasta la producción es enorme. Para los usuarios, es posible que los diseñadores no puedan comprender completamente los productos que necesitan, por lo que no pueden lograr el efecto deseado en poco tiempo.

En función de las necesidades de la industria anteriores, Amazon Cloud Technology lanzó la Guía de soluciones de la industria de IA generativa para ayudar a los clientes a crear fácilmente aplicaciones de IA generativa y resolver problemas comerciales más rápido a través de IA generativa. Adopta la separación de front-end y back-end, computación y arquitectura de separación de almacenamiento, y crea entrenamiento y razonamiento modelo en el servicio SageMaker, que se puede expandir de manera más flexible para lograr un uso multiusuario.

En este artículo, presentaremos la configuración de parámetros de IA generativa para este escenario de la industria según la guía de soluciones de la industria de IA generativa para los tres escenarios típicos de la industria del comercio electrónico: generación de imágenes de prueba de modelos de varios países, diseño de apariencias de productos y generar carteles de productos en diferentes escenarios optimizados para ayudar a los usuarios a obtener un efecto más adecuado para la escena.

Introducción a los escenarios típicos del comercio electrónico de IA generativa

La industria del comercio electrónico, especialmente la industria del comercio electrónico transfronterizo, a menudo se dirige a clientes de todo el mundo. Al promocionar nuevos productos de la temporada, a menudo es mejor combinar los retratos de los clientes y proporcionar representaciones adecuadas para la publicidad.

Tomando como ejemplo el comercio electrónico transfronterizo de ropa de mujer, al lanzar anuncios de ropa de mujer, es necesario tener en cuenta los sentimientos intuitivos de los clientes de diferentes países sobre el efecto de prueba del modelo. Esta es también una de las consideraciones que muchas marcas contratará modelos de diferentes países para mostrar la misma ropa. IA generativa En este escenario, puede usar la máscara integrada en la pintura e ingresar las palabras correspondientes para generar representaciones de prueba de diferentes avatares. De este modo, se ahorra el costo de contratar modelos y se ahorra el tiempo necesario para fotografiar modelos. El diagrama de efectos es el siguiente:

135b2898c2e7399f1e0fbadcf4ce8367.png

Además de la necesidad de generar modelos para probarse en la industria de la ropa de mujer, los escenarios publicitarios típicos en la industria del comercio electrónico también incluyen el diseño del empaque del producto. El empaque exterior del producto está relacionado con el atractivo del producto para los consumidores y el grado de atención que recibe, lo que a menudo afecta las ventas del producto. En términos de diseño, se pueden generar diferentes dibujos de diseño combinando ControlNet con el método de diagrama de Vinsen de IA generativa. Las representaciones son las siguientes:

b62eac63615b5c262cca600a3f73db62.png

Después de completar el diseño del empaque del producto, puede continuar combinando temporadas publicitarias y festivales especiales para generar mapas de uso del producto en diferentes escenarios de uso para atraer clientes y ayudarlos a comprender mejor el producto. Este escenario se puede realizar mediante el uso de Inpaint combinado con gráficos generados por gráficos. Los ejemplos son los siguientes:

84cc08cb48450df17b65474a0b0fb80a.png

6ea6099c06b7b04aa20188eb765919ab.png

Arquitectura y principio de funcionamiento

Este artículo se basa en la guía de soluciones de la industria de IA generativa y su principio de funcionamiento es el siguiente:

51ac9d1c7b5838acb610006b3db6863a.png

Diagrama de arquitectura de guía de solución de IA generativa

Guía de soluciones industriales de IA generativa, la WebUI de difusión estable de front-end se implementa en el servicio de contenedores Amazon ECS, el back-end utiliza el servicio sin servidor Amazon Lambda para el procesamiento, y el front-end y el back-end se comunican a través de llamadas de Amazon API Gateway . El entrenamiento y la implementación de modelos se realizan a través de Amazon SageMaker. Al mismo tiempo, Amazon S3, Amazon EFS y Amazon DynamoDB se utilizan para almacenar datos de modelos, archivos temporales y datos de uso, respectivamente.

Proceso de implementación rápida

Esta guía de soluciones de la industria se puede implementar con un solo clic usando CloudFormation. Si necesita utilizar la guía de soluciones de la industria de IA generativa, puede consultar la interpretación integral de la guía de soluciones de IA generativa, que no se destacará en este artículo.

Parámetros de configuración comunes para escenarios

Ingeniería de palabras rápidas

Las palabras rápidas pueden constar de varias palabras o frases, separadas por ",". Entre ellos, las palabras o frases pueden cambiar el peso de las palabras indicadoras en forma de (indicador: número). Si no hay descripción, el peso predeterminado de la palabra de aviso es 1. En el orden de las palabras clave, el orden del cuerpo principal debe ser lo más temprano posible. Puede consultar el siguiente orden:

Calidad de imagen, estilo, tema, apariencia (peinado, color de cabello, ropa, ojos, brazos, pecho, piernas...), estado de ánimo, pose, fondo

Hay casos detallados en la introducción de seguimiento.

Caso 1: Parámetros de configuración de la caja de reemplazo del modelo

Esta sección toma como ejemplo la generación de One Indian Girl.

1. Seleccione un modelo, se recomienda utilizar un modelo real y guardarlo.

3301de2846db2afe0c5a4a916825e7cd.png

2. Use herramientas de procesamiento de imágenes para procesar la imagen y obtener una imagen enmascarada.

b009937d01cd73d0ff0c572a3ace9612.png

3. Ingrese a la interfaz de generación de gráficos e ingrese las palabras de aviso positivas:

(obra maestra: 1.4), (mejor calidad: 1.2), (ultra alta resolución: 1.2), (resolución de 8k: 1.0), (realista: 1.0), (ultra detallado 1: 0), (enfoque nítido 1: 0), (foto RAW :1.0),

una niña india, piel hermosa detallada, sonrisa amable, solo, absurdos, rostro hermoso detallado, figura pequeña, textura de piel detallada, piel pálida, espacio entre muslos, cabello detallado, estilo de cabello aleatorio, ojos detallados, piel brillante, foto de retrato,

(blue jeans: 1.4), (suéter de punto: 1.4), aretes, futurista, estudio, (fondo blanco: 1.4)

Palabras clave inversas:

(nsfw:1.4),

(Negativo fácil: 1,4), (peor calidad: 1,4), (calidad baja: 1,4), (calidad normal: 1,4),

bajos, monocromo, escalas de grises, manchas en la piel, acné, imperfecciones en la piel, manchas de la edad, 6 dedos más en una mano, deformidad, piernas malas, piernas con errores, pies malos, extremidades malformadas, extremidades adicionales

4242fa6fcce17b8a67f4c009baa1f3f6.png

4. Como se muestra en la imagen, haga clic en el redibujado parcial respectivamente, después de cargar la opción de máscara, cargue la imagen original y la imagen enmascarada:

3b73f7e3fb52644dd4929bcda5ed1259.png

En este paso, el desenfoque de la máscara indica la suavidad de la transición entre el área de dibujo y el borde de la imagen original. Cuanto mayor sea el valor, más suave será la transición entre el área de dibujo y el borde de la imagen original. En este caso, el valor es 6

5. El resto de los parámetros del gráfico son los que se muestran en la figura:

245b44464a68541fd7fb0eb27244d9cc.png

  • Establezca la longitud y el ancho correspondientes de la imagen para evitar la distorsión de la imagen.

  • La pintura facial, cuando está habilitada, ajustará el área de la cara después de generar la imagen.

  • El rango de redibujado indica el grado de cambio de la imagen. Cuanto mayor sea el valor, mayor será el cambio de la imagen. 0 significa que la imagen casi no ha cambiado y 1 significa que puede desviarse seriamente de la imagen original. Generalmente se recomienda que el parámetro esté en el rango de 0.6~0.8. En este caso se establece en 0,7.

  • La semilla aleatoria es un valor que bloquea el estado inicial de la imagen generada.

6. Haga clic en Generar para generar la imagen:

70d10322b63f1e85fca788a3024bc8e2.png

Caso 2: Dibujo de diseño de productos básicos

Esta sección toma como ejemplo la generación del último dibujo de diseño.

1. Seleccione el modelo y guárdelo:

dacce28f8e84abcb9802fbf87d99f9ac.png

2. Continúe deslizándose hacia abajo en la página y establezca el valor de Saltar clip en 2, lo que significa detener el procesamiento de la solicitud por parte de la red neuronal por adelantado. Algunos modelos usan este ajuste durante el entrenamiento, por lo que establecer este valor puede ayudar a lograr mejores resultados en esos modelos. y guarda:

beb3110a7169e983fda35879905fbf41.png

3. Ingrese a la interfaz del diagrama de Vincent e ingrese las palabras de aviso positivas:

fotografía para una lata de jugo de naranja con logo ISA,

fondo simple, fondo blanco,

(obra maestra: 1.2), (mejor calidad: 1.2), (alta resolución: 1.1), (fotorrealista: 1.1)

Palabras clave inversas:

easynegative, logotipo, firma,

5ee50ab8ce25ac19186f3580b674451b.png

4. El resto de los parámetros del gráfico generado se muestran en la figura:

70808be6e434835b2165bf2e53d022d9.png

  • Establezca la longitud y el ancho correspondientes de la imagen para evitar la distorsión de la imagen.

  • Para escenas reales, se pueden obtener resultados relativamente buenos con el muestreador tipo Karras, por lo que el método de muestreo es DPM ++ SDE Karras.

  • La semilla aleatoria es un valor que bloquea el estado inicial de la imagen generada.

  • Saltar clip: 2 se refiere a la detención temprana del procesamiento de sugerencias de la red neuronal. Algunos modelos usan este ajuste durante el entrenamiento, por lo que establecer este valor puede ayudar a lograr mejores resultados en esos modelos.

5. Configure ControlNet:

eb32170bae0da00dc86a8fdc0db68619.png

  • Habilitar ControlNet

  • Con la configuración Pixel Perfect activada, no es necesario configurar manualmente la resolución del preprocesador. Se recomienda abrir

  • Los ajustes restantes se muestran en la figura.

6. Una vez completada la configuración, haga clic en Generar para generar la imagen.

Caso 3: Cambiar el fondo

Esta sección toma como ejemplo la generación de una imagen publicitaria.

1. Seleccione el modelo y guarde:

78bc83be29510fa253ae3d7d8ecf9df9.png

2. Use la herramienta de procesamiento de imágenes para procesar la imagen y obtener la imagen de la máscara:

34155b1f15d6181abb71d10bbe7cd1de.png

3. Ingrese a la interfaz de generación de gráficos e ingrese las palabras de aviso positivas:

(obra maestra: 1.2), (mejor calidad: 1.2), (alta resolución: 1.1), (fotorrealista: 1.1),

fotografía para una lata de jugo de naranja con logo ISA,

fondo estilo navideño, naranja, jugo, comida,

Palabras clave inversas:

easynegative, logotipo, firma,

e21f3a4968757b217406714d845f4c55.png

4. Como se muestra en la imagen, haga clic en Redibujado parcial respectivamente, cargue la máscara y luego cargue la imagen original y la imagen enmascarada:

63b7f713a73d18334c1cf1220539ecab.png

En este paso, el desenfoque de la máscara indica la suavidad de la transición entre el área de dibujo y el borde de la imagen original. Cuanto mayor sea el valor, más suave será la transición entre el área de dibujo y el borde de la imagen original. En este caso, el valor es 2 Y debido a la necesidad de una mayor diferencia entre el fondo y la imagen original, puede elegir "Ruido espacial latente" y "Valor espacial latente cero". En esta escena, "Valor espacial latente cero" tiene un mejor efecto.

5. El resto de los parámetros del gráfico son los que se muestran en la figura:

a2758f99de1a5eeb8816756e18105690.png

  • Establezca la longitud y el ancho correspondientes de la imagen para evitar la distorsión de la imagen.

  • DPM++ 2M Karras fue escogido como método de muestreo debido a la expectativa de resultados enfocados en rapidez, fusión, novedad y buena calidad.

  • El rango de redibujado indica el grado de cambio de la imagen. Cuanto mayor sea el valor, mayor será el cambio de la imagen. 0 significa que la imagen casi no ha cambiado y 1 significa que puede desviarse seriamente de la imagen original. Generalmente se recomienda que el parámetro esté en el rango de 0.6~0.8. Este caso requiere que se dibuje un nuevo fondo completamente diferente sobre el fondo gris, por lo que se eligió 0.95.

  • La semilla aleatoria es un valor que bloquea el estado inicial de la imagen generada.

f108e60ed5344042975701007869411e.png

7. Configure ControlNet1:

8fec7fc5cb48ff6bad1bb9046c2da0b5.png

El uso de ControlNet inpaint puede hacer que la IA tenga una cierta comprensión de la estructura de la imagen completa, evitando resultados demasiado ilimitados.

8. Haga clic en Generar para generar la imagen.

resumen

Los costos de marketing a menudo representan una gran proporción del gasto anual total de la industria del comercio electrónico. En términos de publicidad, la IA generativa puede ayudar a los clientes de comercio electrónico a crear carteles de promoción de productos y exhibiciones de productos de modelos multinacionales virtuales, de modo que para conseguirlo más rápido ya menor coste.Costo de merchandising. Para el diseño, la IA generativa puede ayudar a los diseñadores en el diseño de productos al ingresar palabras clave y proporcionar inspiración básica para los diseñadores. Y la IA generativa proporciona una nueva forma para que los clientes diseñen sus propios productos. Los clientes pueden proporcionar sus propios diseños o imágenes en sus vidas y usar la IA generativa para estilizarlos. Después de confirmar que el efecto es satisfactorio, pueden proporcionar producción. Hasta cierto punto, esto puede reducir el riesgo de devolución debido al diseño y reducir la carga de los diseñadores, haciendo que el diseño sea más rápido y cumpliendo con las expectativas del consumidor, y logrando la diferenciación en la experiencia del usuario.

Este artículo presenta principalmente los parámetros recomendados para tres casos bajo los tres escenarios típicos de comercio electrónico de cambiar el modelo para generar el efecto de prueba, el diseño del empaque del producto y cambiar el fondo para generar la imagen publicitaria del producto. Si desea lograr un efecto similar, puede consultar la configuración de este parámetro. Hay otros escenarios y casos de la industria, consulte nuestra serie de blogs relacionados.

Referencias

1. Guía de soluciones de la industria de IA generativa:

https://aws.amazon.com/cn/campaigns/aigc/

2. Taller de guía de soluciones de la industria de IA generativa:

https://catalog.us-east-1.prod.workshops.aws/workshops/bae25a1f-1a1d-4f3e-996e-6402a9ab8faa

3. Estable-difusión-webui:

https://github.com/AUTOMATIC1111/stable-diffusion-webui

4. Cara de abrazo:

https://huggingface.co/

El autor de este artículo

1f18d24ce5102258cf641893d8203bd3.jpeg

Tang Zhe

Arquitecto de soluciones de la industria de Amazon, responsable de la consultoría y el diseño de la arquitectura de las soluciones informáticas en la nube basadas en Amazon, y también comprometido con la difusión y popularización del sistema de conocimiento del servicio en la nube de Amazon. Tiene experiencia práctica en desarrollo de software, protección de seguridad y otros campos, y actualmente se está enfocando en los campos de comercio electrónico y transmisión en vivo.

d122d6e52009ce7535e73b551566b62a.jpeg

Wang Jinfan

Arquitecto de soluciones de la industria de tecnología en la nube de Amazon, las áreas principales incluyen finanzas, comercio minorista e IA generativa. Trabajó en IBM, responsable de soluciones de clientes en la industria financiera. En la actualidad, tiene como objetivo la promoción de la plataforma de datos de usuario y las soluciones de IA generativa en Hong Kong.

896f20a8af7774c33c8721a4821af7c7.jpeg

huang wei

Arquitecto sénior de soluciones de Amazon Cloud Technology, responsable de los clientes de la industria del comercio electrónico de la Unidad de Negocios Nativos Digitales, tiene más de 10 años de experiencia en diseño de arquitectura minorista, cadena de suministro y cumplimiento de contratos. Actualmente, se enfoca en la investigación sobre el impacto de valor de big data y la tecnología AI/ML en el comercio electrónico, y desarrolla y promueve soluciones relacionadas.

38deb80fd0b414bfe2347cc46766286e.gif

960b425fbc58b524db85ff7e6c1db480.gif

Escuché, haga clic en los 4 botones a continuación

¡No encontrarás errores!

725bcff1ea38e823bede20159e8ef2aa.gif

Supongo que te gusta

Origin blog.csdn.net/u012365585/article/details/131875015
Recomendado
Clasificación