Proceso de optimización de ofertas duales de publicidad de rendimiento iQIYI

01

   Antecedentes del proyecto


La colocación de publicidad de rendimiento es un escenario de juego: la plataforma de medios espera vender el tráfico al precio más alto y el cliente espera que el costo de la publicidad y el efecto final cumplan con los estándares. Con el desarrollo de la industria de la publicidad de rendimiento, los clientes ya no se conforman con evaluar únicamente los efectos de conversión superficiales, como el despertar y la activación. Cada vez más anunciantes expresan sus demandas a las plataformas de medios para optimizar los efectos de back-end. Los efectos de back-end incluyen la tasa de retención, la tasa de pago, el ROI del pago el primer día y otros tipos de conversión profunda.

En este artículo, revisaremos el proceso de optimización de la publicidad basada en resultados en el modelo de oferta.

Las plataformas de medios publicitarios generalmente utilizan un modelo de oferta dual para proteger los costos de conversión superficiales de los anunciantes y los efectos de back-end al mismo tiempo. Las demandas publicitarias de los anunciantes incluyen el cumplimiento superficial de los costos de conversión, el cumplimiento profundo de los costos de conversión y el cumplimiento profundo de la tasa de conversión implícitos en las dos ofertas. Por lo tanto, la plataforma de medios necesita diseñar una fórmula de oferta de eCPM (costo efectivo por mil, ingresos publicitarios por mil impresiones) adecuada para cumplir con los requisitos de los anunciantes y al mismo tiempo maximizar los ingresos de la plataforma de medios.


02

   Historia del proyecto

2.1 Oferta única tradicional

Los clientes solo pujan por un objetivo de conversión (por ejemplo, descarga, reactivación, etc.). La plataforma de medios estima las tasas de clics y las tasas de conversión a través de modelos, convirtiendo el valor de una conversión en el valor de exposición de un segmento de tráfico. Debido a la existencia de una desviación de estimación, es necesario utilizar un factor de oferta adicional α para ajustar la oferta y proteger el costo de conversión del cliente.


El factor de oferta en la fórmula anterior desempeña principalmente dos funciones. En primer lugar, es la calibración de las estimaciones para que el valor de exposición pueda medirse con precisión en función de la tasa de conversión de clics. En segundo lugar, es la selección del tráfico de alta calidad, combinando estimaciones y etiquetas de público para mejorar dinámicamente la capacidad de oferta de los usuarios de alta calidad; tráfico de calidad.

Antes de 2022, hemos alcanzado esta fórmula a un nivel relativamente extremo. Los factores de oferta han cambiado del control proporcional inverso al control de cálculo, de las actualizaciones cada hora a las actualizaciones minuciosas, del control de granularidad única a la agregación dinámica multidimensional, y de una estrategia única a la compatibilidad con lógicas como el arranque en frío, la entrega regular y el volumen agresivo. adquisición. Con la mejora continua de las capacidades de los modelos de predicción y la construcción de algoritmos avanzados de calibración de modelos, los factores de oferta han comenzado a desempeñar un papel más importante en la detección del tráfico de alta calidad. Los costos superficiales dependen de la predicción precisa y la rápida calibración del modelo en sí para que sea estable y controlable. La serie de optimizaciones anterior es otra historia maravillosa que compartiré con ustedes nuevamente cuando tenga la oportunidad.

El desafío se produjo en la segunda mitad de 2021, cuando la industria publicitaria comenzó a pasar por completo a la publicidad de doble oferta. En ese momento, se nos presentó el profundo problema de los costos y los cambios en la estructura presupuestaria hicieron de este problema un obstáculo que debía superarse.

2.2 Oferta doble ponderada

El significado comercial de la doble oferta es: cuando los clientes establecen dos objetivos de oferta, uno superficial y otro profundo, como activación + retención, despertar + pago, etc. Si bien los clientes requieren costos superficiales para cumplir con los estándares, también requieren efectos más profundos para cumplir con los estándares, especialmente estándares de costos elevados. A partir de la segunda mitad de 2021, el control profundo de costos y la optimización se han convertido en los principales puntos débiles durante este período. Para adaptarnos rápidamente a los cambios, adoptamos un enfoque de pequeños pasos y lanzamos rápidamente una doble oferta ponderada.

Para problemas de optimización multiobjetivo, los métodos comúnmente utilizados incluyen la optimización de Pareto y la optimización ponderada. Utilizamos el método óptimo ponderado para agregar factores de control de costos profundos sobre la base de ofertas únicas superficiales, los ponderamos para obtener los factores de control de costos finales y primero resolvemos el problema de si existe un control de costos profundo.


En la fórmula anterior, la lógica de control del factor de oferta profunda reutiliza completamente el marco superficial. En la aplicación real, se encontró que esta estrategia tenía los siguientes defectos:

① Según esta fórmula de oferta, el costo superficial y el costo profundo se afectarán entre sí. Después de la ponderación, se producirá fácilmente un fenómeno de balancín. Si la capa profunda es mejor, la capa superficial será peor y si la capa superficial es mejor. la capa más profunda será peor. Incluso puede haber fluctuaciones cíclicas.

② El factor de oferta es esencialmente un controlador de retroalimentación, que se controla en función de los datos de entrega del día. Para el tráfico con diferentes efectos profundos, no se introduce ninguna estimación basada en datos históricos al ofertar. Es decir, no hay pDCVR involucrado en la fórmula de oferta y la oferta solo se controla en función del desempeño de entrega del día.

Para optimizar los problemas anteriores, realizamos iteraciones continuas.

2.3 Doble oferta de Pareto

El método ponderado garantiza que los costos superficiales y profundos sean óptimos en su conjunto, mientras que exigir que los dos sean óptimos respectivamente es esencialmente un problema de solución óptima de Pareto. Por lo tanto, utilizamos el valor del tráfico y el tráfico objetivo como punto de partida para clasificar la estrategia. Al mismo tiempo, confiamos en las capacidades de predicción del modelo pDCVR que se inician gradualmente para construir una nueva estrategia de oferta dual para lograr un control estable de lo superficial y lo profundo. costos.


Para garantizar que los costos superficiales y profundos cumplan con los estándares al mismo tiempo, introducimos la estimación profunda de la tasa de conversión pDCVR y ajustamos la fórmula de oferta para:


Debido a que el control profundo está estrictamente controlado, la conversión profunda suele ser más escasa, lo que no favorece la acumulación de datos y es difícil impulsar el volumen, lo que afecta los ingresos. Para resolver este problema, controlamos la tasa objetivo introduciendo un coeficiente de corrección w para mejorar la capacidad de funcionamiento. Al mismo tiempo, para garantizar el efecto, w se controla en línea en tiempo real.


En teoría, esta fórmula de licitación controla estrictamente tanto los costos profundos como los costos superficiales. Dado que la acumulación de datos de transformación profunda es más lenta que la de datos superficiales, a menudo en uno o incluso varios órdenes de magnitud, el modelo pDCVR se encuentra en un estado de clasificación relativamente precisa durante este período, pero con una precisión insuficiente. Por lo tanto, utilizamos indirectamente la estimación profunda como base para juzgar la calidad del tráfico, lo que afecta el factor de oferta profunda. Esta fórmula de licitación resuelve hasta cierto punto los dos problemas del punto 2.2. Pero surge un nuevo problema:

①Entre  el control estricto de los costos profundos y el aumento de volumen, es necesario utilizar un coeficiente de corrección w para equilibrar, pero es difícil determinar el coeficiente óptimo para lograr el equilibrio deseado.

② El límite de oferta para el tráfico de alta calidad de nivel profundo es la oferta que cumple con el estándar de costo de nivel superficial. Esta oferta es demasiado conservadora para el tráfico de alta calidad de nivel profundo. En comparación con el modelo de oferta única de nivel profundo, este modelo suprime el tráfico de alta calidad y reducirá la tasa de conversión de nivel profundo.

③ Si el costo superficial y el costo profundo cumplen con el estándar al mismo tiempo, no se puede garantizar que la tasa de conversión profunda alcance el estándar. Bajo la tendencia general de la publicidad, la evaluación de los clientes sobre la tasa de retención secundaria, la tasa de retención a largo plazo y el ROI son a menudo cuestiones de tasa, en lugar de simples cuestiones de cumplimiento de costos profundamente arraigadas.


Las preguntas anteriores se pueden resumir de la siguiente manera: ¿ Cómo lograr un cumplimiento de costos superficial y al mismo tiempo lograr un cumplimiento profundo de la tasa de conversión? ¿Cómo mejorar paulatinamente los costes y al mismo tiempo liberar el consumo durante el proceso de entrega?

2.4 Oferta doble adaptativa

Para resolver los problemas anteriores, además de mejorar la precisión del modelo pDCVR a largo plazo, un método más eficaz es lograr avances en el mecanismo de evaluación del valor del tráfico. Así que repetimos una nueva versión de la estrategia de oferta. Los objetivos son los siguientes:

① Optimice aún más el tráfico para lograr una doble optimización del costo profundo y la tasa de conversión profunda.

② Mientras optimiza el tráfico, fortalezca las capacidades de oferta y oferta del tráfico de alta calidad para resolver el problema de la reducción del volumen si el efecto no es bueno.

Con respecto al mecanismo de oferta, confiando en la mejora continua de las capacidades del modelo de predicción profunda, hemos fortalecido el papel de pDCVR en la predicción de ofertas en comparación con la fórmula de oferta en la versión 2.3. Esto lleva a una nueva fórmula de oferta:


Entre ellas, la función φ es una función en forma de S, a partir de la cual se calcula el factor de control del efecto profundo final. La siguiente figura muestra dos curvas de función φ g diferentes que se pueden seleccionar.


eta es el factor de control de curvatura de la función, DCVR es la tasa de conversión profunda real de la entrega actual y T es la tasa de conversión profunda objetivo del cliente.


Su lógica de control de ofertas es la siguiente:

(1) Cuando DCVR>=T, la curvatura η de la función es un valor mínimo y la curva de la función básicamente coincide con el eje x. En este momento, no importa si el pDCVR es alto o bajo, el valor de la función φ es básicamente el mismo y no hay intervención en la licitación. Puede ejecutar tanto volumen como sea posible de acuerdo con los requisitos de cumplimiento de costos bajos.

(2) Cuando DCVR <T, el controlador levanta η y la curvatura de la función aumenta de manera conservadora y el tráfico con pDCVR alto ofrece de manera agresiva, por lo que DCVR aumenta cuando DCVR se acerca a T, el algoritmo de control controla la curvatura. eta para disminuir, logrando así el equilibrio dinámico.

(3) Cuando DCVR << T, la curvatura η se eleva al valor máximo, el tráfico de pDCVR bajo se abandona durante la oferta y el tráfico de pDCVR alto se oferta activamente, lo que hace que E (pDCVR) aumente continuamente, haciendo que DCVR se acerque a T , repitiendo así el paso (2) ) para lograr el equilibrio dinámico.

En este punto, en función de las demandas de entrega de back-end de diferentes clientes, ya sea costo de pago, tasa de retención secundaria o ROI del primer día, etc., combinado con modelos de estimación de conversión profunda, como estimación de tasa de pago, estimación de tasa de retención secundaria y estimación del monto del pago. Se ha evaluado de manera efectiva el valor profundo de un solo flujo de tráfico. La oferta dual adaptativa utiliza pDCVR para filtrar e identificar el tráfico de alta calidad. Se basa en una estrategia de oferta no lineal. Cuando hay una brecha entre el efecto y el objetivo, se descarta parte del tráfico de baja calidad. Realice ofertas de forma más agresiva para obtener exposición en tráfico de alta calidad para lograr los mejores resultados. Lograr el propósito de lograr continuamente un efecto de aumento e inclinar gradualmente y automáticamente el consumo hacia un tráfico de alta calidad. También hay algunos pequeños detalles, como la función g que tiene en cuenta las etiquetas de multitud al mismo tiempo, etc., que no se ampliarán aquí.


03

   efecto en línea


Se lanzan varias versiones de forma iterativa, lo que impulsa de forma acumulativa mejoras en el rendimiento de la publicidad:



04

   Resumen y perspectivas


Cualquier estrategia de oferta se basa en la capacidad de predicción del modelo y está estrechamente relacionada con la construcción de etiquetas colectivas, la lógica de asignación de presupuesto, el diseño de estrategias de oferta, etc. Actualmente, a medida que los objetivos de evaluación de los clientes se vuelven cada vez más estrictos y los modelos de licitación continúan evolucionando, el sistema de evaluación del valor del tráfico debe iterarse continuamente para satisfacer las necesidades del desarrollo empresarial. En el futuro, optimizaremos aún más en las siguientes direcciones:

  • Control profundo de efectos con datos extremadamente escasos

  • Optimización de efectos bajo un retraso de conversión profundo

  • Fluctuaciones de efectos causadas por cambios en el entorno de ofertas en tiempo real

  • Marco de ofertas automatizadas sensible al contexto

Quizás tú también quieras ver
Práctica de iQIYI Data Lake: aplicación de Data Lake de publicidad
Práctica de aplicación de Apache Spark en iQiyi
Revelando el secreto de la explosión de la memoria: resolviendo el problema OOM del entrenamiento distribuido de modelos grandes

Este artículo se comparte desde la cuenta pública de WeChat: Equipo de productos de tecnología iQIYI (iQIYI-TP).
Si hay alguna infracción, comuníquese con [email protected] para eliminarla.
Este artículo participa en el " Plan de creación de fuentes OSC ". Los que están leyendo pueden unirse y compartir juntos.

¡Compañero pollo deepin-IDE de "código abierto" y finalmente logró el arranque! Buen chico, Tencent realmente ha convertido Switch en una "máquina de aprendizaje pensante" Revisión de fallas de Tencent Cloud del 8 de abril y explicación de la situación Reconstrucción de inicio de escritorio remoto de RustDesk Cliente web Base de datos de terminal de código abierto WeChat basada en SQLite WCDB marcó el comienzo de una actualización importante Lista de abril de TIOBE: PHP cayó a un mínimo histórico, Fabrice Bellard, el padre de FFmpeg, lanzó la herramienta de compresión de audio TSAC , Google lanzó un modelo de código grande, CodeGemma , ¿te va a matar? Es tan bueno que es de código abierto: herramienta de edición de carteles e imágenes de código abierto
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/4484233/blog/10122362
Recomendado
Clasificación