Processo de otimização de lance duplo de publicidade de desempenho iQIYI

Wuhan Yuan Chuanghui retorna, vamos falar sobre modelos grandes em 20 de abril”

Antecedentes do projeto

A colocação de publicidade de desempenho é um cenário de jogo: a plataforma de mídia espera vender o tráfego pelo preço mais alto e o cliente espera que o custo da publicidade e o efeito back-end atendam aos padrões. Com o desenvolvimento da indústria de publicidade de desempenho, os clientes não estão mais satisfeitos em avaliar apenas efeitos de conversão superficiais, como despertar e ativação. Cada vez mais anunciantes expressam suas demandas às plataformas de mídia para otimizar os efeitos de back-end. Os efeitos de back-end incluem taxa de retenção, taxa de pagamento, ROI de pagamento no primeiro dia e outros tipos de conversão profunda.

Neste artigo, revisaremos o processo de otimização da publicidade de desempenho no modelo de licitação.

As plataformas de mídia publicitária geralmente usam um modelo de lance duplo para proteger os baixos custos de conversão e os efeitos de back-end dos anunciantes ao mesmo tempo. As demandas de publicidade dos anunciantes incluem conformidade superficial com custos de conversão, conformidade profunda com custos de conversão e conformidade profunda com taxas de conversão implícitas nos dois lances. Portanto, a plataforma de mídia precisa projetar uma fórmula de lance de eCPM (custo efetivo por mil, receita de publicidade por mil impressões) apropriada para atender aos requisitos dos anunciantes e, ao mesmo tempo, maximizar a receita da plataforma de mídia.

História do projeto

2.1 Lance único tradicional

Os clientes oferecem lances apenas para uma meta de conversão (por exemplo, download, ativação, etc.). A plataforma de mídia estima taxas de cliques e taxas de conversão por meio de modelos, convertendo o valor de uma conversão no valor de exposição de um tráfego. Devido à existência de desvio de estimativa, um fator de licitação adicional α precisa ser usado para ajustar a licitação e proteger o custo de conversão do cliente.

O fator de oferta na fórmula acima desempenha principalmente duas funções. Primeiro, é a calibração das estimativas para que o valor da exposição possa ser medido com precisão com base na taxa de conversão de cliques. Em segundo lugar, é a triagem do tráfego de alta qualidade, combinando estimativas e crowd tags para melhorar dinamicamente a capacidade de lances de alta qualidade; tráfego de qualidade.

Antes de 2022, atingimos esta fórmula a um nível relativamente extremo. Os fatores de lance mudaram de controle proporcional inverso para controle de cálculo, de atualizações de hora em hora para atualizações de minuto, de controle de granularidade único para agregação dinâmica multidimensional e de uma estratégia única para compatibilidade com lógica como inicialização a frio, entrega regular e volume agressivo aquisição. Com a melhoria contínua das capacidades dos modelos de previsão e a construção de algoritmos avançados de calibração de modelos, os fatores de licitação começaram a desempenhar um papel mais importante na triagem do tráfego de alta qualidade. Os custos superficiais dependem da previsão precisa e da calibração rápida do próprio modelo para ser estável e controlável. A série de otimizações acima é outra história maravilhosa que compartilharei com vocês novamente quando tiver oportunidade.

O desafio ocorreu no segundo semestre de 2021, quando a indústria da publicidade começou a mudar totalmente para a publicidade de oferta dupla. Nesta altura, o profundo problema dos custos foi colocado diante de nós, e as mudanças na estrutura orçamental tornaram este problema num obstáculo que deve ser ultrapassado.

2.2 Lance duplo ponderado

O significado comercial do lance duplo é: quando os clientes definem duas metas de lance, uma superficial e outra profunda, como ativação + retenção, despertar + pagamento, etc. Embora os clientes exijam custos superficiais para cumprir os padrões, eles também exigem efeitos mais profundos para cumprir os padrões, especialmente padrões de custos profundos. A partir do segundo semestre de 2021, o profundo controle e otimização de custos tornaram-se os principais pontos problemáticos durante este período. Para nos adaptarmos rapidamente às mudanças, adotamos uma abordagem em pequenos passos e lançamos rapidamente a licitação dupla ponderada.

Para problemas de otimização multiobjetivo, os métodos comumente usados incluem otimalidade de Pareto e otimalidade ponderada. Usamos o método ideal ponderado para adicionar fatores de controle de custos profundos com base em propostas únicas superficiais, ponderá-los para obter os fatores de controle de custos finais e primeiro resolver o problema de saber se existe um controle de custos profundo.

Na fórmula acima, a lógica de controle do fator de lance profundo reutiliza completamente a estrutura superficial. Na aplicação real, descobriu-se que esta estratégia apresentava as seguintes falhas:

① De acordo com esta fórmula de licitação, o custo superficial e o custo profundo afetarão um ao outro. Após a ponderação, ocorrerá facilmente um fenômeno de gangorra. Se a camada profunda for melhor, a camada rasa será pior, e se a camada rasa for melhor. a camada mais profunda será pior. Pode até haver flutuações cíclicas.

② O fator de licitação é essencialmente um controlador de feedback, que é controlado com base nos dados de entrega do dia. Para tráfego com diferentes efeitos profundos, nenhuma estimativa baseada em dados históricos é introduzida durante a licitação. Ou seja, não há pDCVR envolvido na fórmula de licitação, e a licitação só é controlada com base no desempenho de entrega do dia.

Para otimizar os problemas acima, conduzimos iterações contínuas.

2.3 Lance duplo de Pareto

O método ponderado garante que os custos superficiais e profundos sejam ótimos como um todo, enquanto exigir que os dois sejam ótimos, respectivamente, é essencialmente um problema de solução ótima de Pareto. Portanto, usamos o valor do tráfego e o tráfego alvo como ponto de partida para resolver a estratégia. Ao mesmo tempo, contamos com os recursos de previsão do modelo pDCVR gradualmente iniciados para construir uma nova estratégia de lance duplo para alcançar o controle estável de raso e profundo. custos.

Para garantir que os custos superficiais e profundos atendam aos padrões ao mesmo tempo, introduzimos a estimativa profunda da taxa de conversão pDCVR e ajustamos a fórmula de licitação para:

Como o controle profundo é estritamente controlado, a conversão profunda costuma ser mais esparsa, o que não conduz ao acúmulo de dados e é difícil aumentar o volume, afetando a receita. Para resolver este problema, controlamos a taxa alvo introduzindo um coeficiente de correção w para melhorar a capacidade de funcionamento. Ao mesmo tempo, para garantir o efeito, w é controlado online em tempo real.

Esta fórmula de licitação teoricamente controla estritamente tanto os custos profundos quanto os custos superficiais. Como o acúmulo de dados de transformação profunda é mais lento do que o de dados superficiais, muitas vezes em uma ou mesmo múltiplas ordens de magnitude, o modelo pDCVR está em um estado de classificação relativamente precisa durante este período, mas com precisão insuficiente. Portanto, usamos a estimativa profunda indiretamente como base para julgar a qualidade do tráfego, afetando assim o fator de lance profundo. Esta fórmula de licitação resolve até certo ponto os dois problemas do item 2.2. Mas surge um novo problema:

①Entre o controle rigoroso dos custos profundos e o aumento do volume, um coeficiente de correção w precisa ser usado para equilibrar, mas é difícil determinar o coeficiente ideal para alcançar o equilíbrio desejado.

② O limite de lance para tráfego profundo de alta qualidade é o lance que atende ao padrão de custo de nível superficial. Este lance é muito conservador para tráfego de alta qualidade em nível profundo. Em comparação com o modelo de lance único de nível profundo, esse modelo suprime o tráfego de alta qualidade e reduzirá a taxa de conversão de nível profundo.

③ Se o custo superficial e o custo profundo atenderem ao padrão ao mesmo tempo, não será possível garantir que a taxa de conversão profunda atinja o padrão. De acordo com a tendência geral da publicidade, a avaliação dos clientes sobre a taxa de retenção secundária, a taxa de retenção a longo prazo e o ROI são frequentemente questões de taxa, em vez de simples questões profundas de conformidade de custos.

As questões acima podem ser resumidas da seguinte forma: Como alcançar uma conformidade de custos superficial e ao mesmo tempo alcançar uma conformidade profunda com a taxa de conversão? Como melhorar gradativamente os custos e ao mesmo tempo liberar o consumo durante o processo de entrega?

2.4 Lance duplo adaptativo

A fim de resolver os problemas acima, além de melhorar a precisão do modelo pDCVR a longo prazo, um método mais eficaz é fazer avanços no mecanismo de avaliação do valor do tráfego. Então, iteramos em uma nova versão da estratégia de lances. Os objetivos são os seguintes:

① Otimize ainda mais o tráfego para obter otimização dupla de custos profundos e taxa de conversão profunda.

② Ao otimizar o tráfego, fortaleça as capacidades de licitação e licitação de tráfego de alta qualidade para resolver o problema de redução do volume se o efeito não for bom.

No que diz respeito ao mecanismo de licitação, contando com a melhoria contínua das capacidades do modelo de predição profunda, fortalecemos o papel do pDCVR na previsão de licitação em comparação com a fórmula de licitação na versão 2.3. Isso leva a uma nova fórmula de licitação:

Entre elas, a função φ é uma função em forma de S, com base na qual o fator de controle de efeito profundo final é calculado. A figura abaixo mostra duas curvas de função φ diferentes g que podem ser selecionadas.

eta é o fator de controle da curvatura da função, DCVR é a taxa de conversão profunda real da entrega atual e T é a taxa de conversão profunda desejada do cliente.

Sua lógica de controle de lances é a seguinte:

(1) Quando DCVR>=T, a curvatura η da função é um valor mínimo e a curva da função basicamente coincide com o eixo x. Neste momento, não importa se o pDCVR é alto ou baixo, o valor da função φ é basicamente o mesmo e não há intervenção na licitação. Você pode operar o máximo volume possível de acordo com os requisitos de conformidade com custos rasos.

(2) Quando DCVR < T, o controlador aumenta η e a curvatura da função aumenta O tráfego com lances de pDCVR baixos de forma conservadora e o tráfego com lances de pDCVR altos de forma agressiva, então o DCVR aumenta quando o DCVR se aproxima de T, o algoritmo de controle controla a curvatura. eta diminuir. Alcançando assim o equilíbrio dinâmico.

(3) Quando DCVR<<T, a curvatura η é puxada para o valor máximo, o tráfego baixo de pDCVR é abandonado durante a licitação e o tráfego alto de pDCVR é licitado ativamente, fazendo com que E (pDCVR) aumente continuamente, tornando o DCVR próximo de T , repetindo assim a etapa (2)) para alcançar o equilíbrio dinâmico.

Neste ponto, com base nas demandas de entrega back-end de diferentes clientes, seja custo de pagamento, taxa de retenção secundária ou ROI no primeiro dia, etc., combinado com modelos profundos de estimativa de conversão, como estimativa de taxa de pagamento, taxa de retenção secundária estimativa e estimativa do valor do pagamento. O valor profundo de um único fluxo de tráfego foi avaliado de forma eficaz. A licitação dupla adaptativa usa pDCVR para rastrear e identificar tráfego de alta qualidade. Ela se baseia em uma estratégia de licitação não linear. Quando há uma lacuna entre o efeito e o alvo, algum tráfego de baixa qualidade é descartado. define lances mais agressivos para exposição em tráfego de alta qualidade para obter os melhores resultados. Alcançar o objetivo de alcançar continuamente o efeito de escalada e inclinar gradualmente o consumo para tráfego de alta qualidade. Existem também alguns pequenos detalhes, como a função g que leva em consideração rótulos de multidão ao mesmo tempo, etc., que não serão expandidos aqui.

Efeito on-line

Várias versões são lançadas iterativamente, impulsionando cumulativamente melhorias de publicidade de desempenho:

Resumo e Perspectiva

Qualquer estratégia de licitação é baseada na capacidade de previsão do modelo e está intimamente relacionada à construção de rótulos de multidão, lógica de alocação orçamentária, desenho de estratégias de licitação, etc. Atualmente, à medida que as metas de avaliação dos clientes se tornam cada vez mais rigorosas e os modelos de licitação continuam a evoluir, o sistema de avaliação do valor do tráfego precisa ser continuamente iterado para atender às necessidades de desenvolvimento do negócio. No futuro, otimizaremos ainda mais nas seguintes direções:

Controle profundo de efeitos sob dados extremamente esparsos
Otimização de efeito sob profundo atraso de conversão
Flutuações de efeito causadas por mudanças no ambiente de lances em tempo real
Estrutura de lances automáticos com base no contexto

Talvez você também queira ver

Prática iQIYI Data Lake - Aplicativo Publicidade Data Lake

Prática de aplicação do Apache Spark no iQiyi

Revelando o segredo da explosão de memória: resolvendo o problema OOM de treinamento distribuído de modelos grandes

Este artigo é compartilhado pela conta pública do WeChat - iQIYI Technology Product Team (iQIYI-TP).
Se houver alguma violação, entre em contato com [email protected] para exclusão.
Este artigo participa do “ Plano de Criação da Fonte OSC ”. Você que está lendo é bem-vindo para participar e compartilhar juntos.