Algumas Explorações e Práticas sobre "Licitação Inteligente"

fundo

Em todo o link do marketing de publicidade digital móvel, existem três assuntos principais, ou seja, mídia, adx e dsp. Para um sistema adx, existem duas funções principais, a saber:

  1. Docking media downstream: agregando tráfego de publicidade de mídia downstream

  1. Uplink DSP (anunciante): Venda tráfego de mídia para upstream DSP (ou anunciante) para obter receita.

Como plataforma de agregação de tráfego, por um lado, a adx obtém receita de publicidade dos anunciantes e, por outro lado, paga à mídia pelo uso do tráfego do espaço publicitário na mídia. Essas receitas e despesas são a principal forma de receita da adx e são usadas para obter lucros.

O principal problema a ser resolvido pelo sistema de licitação inteligente é: como maximizar o lucro bruto entre receitas e despesas? Nesse problema, de maneira geral, o lado do rendimento é o preço da transação com dsp na forma de um preço ou dois preços via rta (sistema de lances em tempo real), mas o problema estudado hoje é que o preço de transação da plataforma é conhecida (ou determinada) situação; isso leva a outra questão, ou seja, no caso do reconhecimento de receita, como planejar os gastos para garantir a maximização do lucro bruto, pois:

Lucro bruto = preço da transação da plataforma - preço da transação da mídia

Mas no cenário atual de negócios, o lucro bruto não é um problema de subtração tão simples, porque também envolve a questão da exposição, especificamente duas questões:

  1. Preço baixo para a mídia: alto lucro bruto, mas baixa exposição (se o anúncio não for exposto, não haverá receita)

  1. Preços altos para a mídia: alta exposição, mas baixo lucro bruto.

Portanto, há um equilíbrio quando se trata de licitação para a mídia. O “lance inteligente” de hoje refere-se à licitação para a mídia para maximizar nosso lucro bruto enquanto libera nossos colegas operacionais e melhora sua eficiência operacional.

modelo básico

Do pano de fundo acima, podemos ver que o método de cálculo do lucro bruto é uma simples operação de subtração, o preço de transação da plataforma menos o preço de transação da mídia, mas também sabemos que se o anúncio não for exposto, o anunciante não nos pagar, portanto, se for incompleto considerar o problema apenas dos dois aspectos do preço de transação da plataforma e do lance de mídia, também precisamos envolver a questão da exposição. De um modo geral, podemos calcular a receita de lucro bruto que um anúncio pode trazer (maximização da expectativa) com base na taxa de exposição. O método de cálculo específico é o seguinte:

Função de valor = max( (preço de transação de plataforma - preço de transação de mídia) * taxa de exposição)

O que esta função quer expressar é:

  1. Taxa de exposição: Para dados históricos, calcule a taxa de exposição de cada lance (com precisão de um dígito) (o sistema de cálculo em tempo real pode ser usado para estatísticas)

  1. Preço de transação de mídia: com base em dados históricos, calcule o preço de transação de cada lance (com precisão de um dígito) no lado da mídia

  1. (Preço de transação de plataforma - Preço de transação de mídia): lucro bruto real

  1. (Preço de transação de plataforma - preço de transação de mídia) *Taxa de exposição: Pode ser entendida como a expectativa de lucro bruto Claro que existe uma certa diferença entre a expectativa aqui e a expectativa em matemática.

A função de valor acima é um padrão para o lance final, e o preço calculado pelo lance com a função de maior valor será pago a esse preço.

Desenvolvimento da primeira versão

Lado do algoritmo: Use o sistema de computação em tempo real flink para calcular o número de exposições α, o número de não-exposições β e o preço médio da transação γ no lado da mídia para cada lance nos últimos dois minutos com base nas dimensões da plataforma e espaço publicitário. Forme a seguinte estrutura de dados e armazene-a no cluster redis:

chave: espaço platform_advertising

valor: 出合1:a,b,c| 出合2:a,b,c|

Lado do serviço: Para a plataforma + espaço publicitário, pegue o valor correspondente de redis, calcule a função de valor de cada lance e pegue o lance com a função de maior valor como o lance final para a mídia. Nossa função de valor é a seguinte:

Função de valor = max( (preço de transação de plataforma - preço de transação de mídia) * taxa de exposição)

Preço da transação da plataforma: Conhecido

Preço médio de transação de mídia: ¶

Taxa de exposição: α / (α + β)

Desvantagens: Após a prática em cenários reais de negócios online, descobriu-se que tais algoritmos são mais propensos a pagar preços baixos à mídia para obter maior lucro bruto. A razão é que nossa função de valor (lucro bruto = preço de transação da plataforma - preço de transação da mídia ), quando oferecemos um preço baixo, o lucro bruto pode ser maximizado. Mas obviamente há outro problema envolvido aqui, ou seja, lances baixos e lucro bruto alto, mas a taxa de exposição do lado da mídia será afetada, então não podemos obter uma certa escala de exposição. Isso é o que eu disse em o início, a situação de lances baixos O problema de alto lucro bruto, mas baixa exposição. Para resolver esse problema, precisamos revisar a meta inicial, de maximizar o lucro bruto do negócio para maximizar o lucro bruto com base na expansão da escala.

Método de melhoria subsequente: aumentar o coeficiente de ajuste de preço inferior da plataforma + espaço publicitário, primeiro para evitar que o lance seja muito baixo e não obter exposição e ajustar dinamicamente o lance mais baixo de acordo com o coeficiente de ajuste de preço inferior para maximizar o lucro bruto . Veja o próximo capítulo para o plano de implementação específico.

Fator de ajuste do preço base

No capítulo anterior, mencionamos que para resolver o problema de sempre pagar preços baixos à mídia e não obter exposição, propusemos um plano para aumentar o "coeficiente de ajuste do preço base". O significado real do "coeficiente de ajuste do preço de reserva" mencionado aqui é na verdade um coeficiente do lance mínimo, por exemplo:

Se nosso coeficiente for definido em 0,5 e o preço da transação na plataforma for 100 yuan, o menor lance que posso dar à mídia é 100*0,5 = 50 yuan, ou seja, não considerarei lances abaixo de 50 yuan. o valor máximo entre 50 e 100 yuan, para que possamos minimizar o preço baixo, de modo a aumentar nossa taxa de exposição (ou seja, a escala de exposição).

Para encontrar o melhor coeficiente de ajuste do preço de reserva, precisamos ajustar dinamicamente o coeficiente do preço de reserva. O plano de implementação específico é o seguinte:

Estratégia de implementação: o coeficiente de preço base da dimensão de plataforma de espaço de anúncio padrão é 0,5. Quando a estratégia é iniciada, 0,5 e 0,6 são preferidos para comparação. Se 0,5 for melhor que 0,6 (consulte a tarefa de tempo para a estratégia de comparação), significa que o coeficiente mais baixo é melhor, então compare 0,4 e 0,5; se 0,6 for melhor, significa que o coeficiente mais alto é melhor, então compare o efeito de 0,6 e 0,7; isto é, cada comparação eliminará o efeito mais pobre, se o valor do coeficiente é menor que o melhor, o valor de comparação subsequente -0,1, se o valor do coeficiente for o melhor, o valor de comparação subsequente +0,1

Tarefa cronometrada: calcule o número de lançamentos de mídia correspondentes ao espaço de publicidade da plataforma para este coeficiente a cada hora, bem como a "taxa de aumento da taxa de exposição" e a "taxa de aumento de lucro bruto de mil vezes" sob os dois coeficientes A\B. O método de comparação é:

1. O número de envio atual > limite (configurável)

-- Se a taxa de aumento da taxa de exposição de A e a taxa de aumento de lucro bruto de 1.000 vezes em relação a B forem ambas positivas, então A é melhor que B, caso contrário, B é melhor que A

-- Se A for comparado com B, o aumento na taxa de exposição é positivo e o aumento no lucro bruto por mil vezes é negativo, calcule a taxa de aumento da taxa de exposição de A/taxa de aumento do lucro bruto de B por mil vezes >= 1 , então A é melhor que B, caso contrário B é melhor que A

2. O número de problemas atuais < limite

Não faça nada e continue acumulando até que o número acumulado seja maior que o limite

Intervalo de lance de mídia: [MAX (max (preço base de mídia, lance mínimo de mídia), min (preço de transação de plataforma * desconto * coeficiente de ajuste, lance máximo de mídia * coeficiente de ajuste)), MIN (preço de transação de plataforma * desconto, lance máximo de mídia) ]

Desvantagens: Após a prática em cenários reais de negócios on-line, descobriu-se que, por meio do ajuste dinâmico contínuo dos coeficientes de licitação, fenômenos extremos de coeficientes aparecerão on-line. desempenho de lucro Quando for melhor, o coeficiente permanecerá sempre entre 0,8 e 0,9. Nesse momento, se o preço da transação no lado da plataforma for maior, o preço da oferta no lado da mídia também aumentará. No entanto, o preço alto não afetam o aumento da exposição, mas a margem de lucro bruto cai significativamente. (No lado da mídia, as taxas de exposição correspondentes de 60 e 40 são semelhantes, por que não 40?)

A próxima estratégia de otimização:

1. Ainda é necessário encontrar uma maneira de remover o parâmetro do coeficiente do preço de reserva e deixar o algoritmo ajustar automaticamente o lance de acordo com a situação real.

2. A julgar pelo progresso atual, esta versão tem o melhor efeito de emitir lucro bruto mil vezes. Devido a razões históricas, esta versão é definida como versão V5. O efeito de evolução de todas as versões futuras será comparado com esta versão, e o efeito Apontar para versões além da V5.

3. Os valores α e β da taxa de exposição calculada anteriormente são obtidos com base na exposição acumulada e no valor não exposto da situação real. De acordo com os dados reais, a taxa de exposição de diferentes lances é desigual e o preço pode ser Para resolver este problema, melhoramos o algoritmo de cálculo da taxa de exposição, para que teoricamente apresente um efeito incremental, ou seja, quanto maior o lance, maior a taxa de exposição.

Otimização de exposição

A taxa de exposição anterior é atualizada pelo mecanismo de punição de incentivo de ponto único. A chamada penalidade de incentivo de ponto único significa que se o anúncio for exposto ou não exposto sob um determinado lance, apenas os valores α e β do lance são atualizados, mas depois de pensar bem, você pode usar o mecanismo de incentivos e punições de intervalo para atualizar. Os chamados incentivos e penalidades de intervalo referem-se ao fato de que, no caso de um determinado lance, o anúncio é exposto ou não exposto, não apenas os valores α e β do lance são atualizados, mas também os outros lances α, β também fazem penalidades e incentivos correspondentes.

Punição de Incentivo de Intervalo - A Primeira Evolução

Nesta evolução, a punição de incentivo de intervalo é voltada principalmente para duas situações

情况1:如果某个出价未曝光,则小于这个出价的所有出价的β都进行更新:β + 1;而大于该出价的所有出价不进行更新。

情况2:如果某个出价曝光,则大于这个出价的所有出价的α都进行更新:α + 1;而小于该出价的所有出价不进行更新。

优点:解决了之前使之从理论上呈现出来一种递增效果,即:出价越高,曝光率越高。

缺点:使用这种更新方式,在高价部分的曝光率会出现一样的情况(如下图),导致算法给出的价格比V5版本低的情况,为了解决这个问题,我们对区间激励惩罚机制进行了二次演进。

区间激励惩罚--第二次演进

为了解决第一次演进过程中,在高价部分曝光率一样的问题,进过进一步的思考和优化,认为在进行区间激励惩罚的过程中,针对不同的出价的激励惩罚程度应该是不一样的,具体来说,还是分为两种情况:

1、出价曝光的情况

(1)、高于该出价的出价:应该也会曝光,所以更新方式和第一次演进应该是一样的,即α + 1

(2)、低于该出价的出价:在第一次演进版本中,未对该部分进行更新。但是经过分析认为,如果当前价格曝光,则出价低于当前价格时,应该也有曝光的机会,所以对这一部分的出价,也应该给予一定的激励和惩罚,激励惩罚方式为:价格越低,α 更新越少,β更新越多,但总体α + β = 1

2、出价未曝光的情况

(1)、低于该出价的出价:应该也不会曝光,所以更新方式和第一次演进应该是一样的,即β + 1

(2)、高于该出价的出价:在第一次演进版本中,未对该部分进行更新。但是经过分析认为,如果当前价格未曝光,但出价高于当前价格时,应该有曝光的机会,所以对这一部分的出价,也应该给予一定的激励和惩罚,激励惩罚方式为:价格越高,α 更新越多,β更新越少,但α + β = 1

3、α,β更新方式

针对新的α,β更新方式,确定了两种形式,一种是对数函数的方式,一种是等比例方式。

更新方式

当前价格(curprice)曝光,价格(price)低于当前价格

当前价格(curprice)曝光,价格(price)高于当前价格

当前价格(curprice)未曝光,价格(price)低于当前价格

当前价格(curprice)未曝光,价格(price)高于当前价格

等比例更新

up=(curprice - price)/(curprice - 1)

α + (1 - up)

β + up

α + 1

β不变

β + 1

α 不变

up=(price - curprice)/(100- curprice)

α + up

β + (1-up)

对数更新

up=Math.log(curprice - price)/Math.log(curprice - 1)

α + (1 - up)

β + up

α + 1

β不变

β + 1

α 不变

up=Math.log(price - curprice)/Math.log(100- curprice)

α + up

β + (1-up)

备注:curprice:当前出价 ; price:要计算α,β的出价 ; Math.log进行对数运算

经过模拟试验,这两种更新方式的最终的曝光率效果如下:

4、优点

解决了第一次曝光率演进过程中出现的高价部分曝光率未区分开的问题,使用这种针对不同出价进行不同程度的激励惩罚方式,再结合下一章中毛利额优化之后的函数,可以较好的解决高价出不上去的问题。

毛利额函数优化

为了便于描述,这里将价值函数再列一下:

价值函数= max( (平台成交价 - 媒体成交价) * 曝光率 )

可以看到在这个函数中,在计算价值函数的时,毛利额直接使用的是“平台成交价 - 媒体成交价”,用这种计算方式进行计算,有两个问题:

(1)、对于不同的媒体成交价(给媒体的出价),他们的毛利额比值过大。

举个简单的例子,当平台成交价是100元时,出价10元,毛利额是90;出价90元,毛利额是10元,毛利额之间的差距是9倍,如果想要用90元进行出价,则90元的曝光率必须是10元的9倍,而这种程度的比例在曝光率中是很难拉回来的。

(2)、曝光率和毛利额的单位不对等的问题:曝光率的值始终是在0~1之间,而毛利额的值在0~100之间。

为了解决上述两个问题,想到一个解决办法,针对毛利额进行归一化处理,将毛利额也归一到0~1之间,同时缩小不同出价的毛利额之间的比例,使用对数函数的方式进行归一化处理,归一化函数如下:

使用这种方式,就将之前的价值和函数变为:

价值函数= max( 归一化毛利额 * 曝光率 )

本地模拟程序构建

为了在上线之前看到实际的演进效果,在本地构建智能出价的模拟程序,目的有三:

1、针对提出的演进方式,进行本地模拟,观察曝光率及毛利额的最终效果是否如预期

2、观察出价能力能否赶上V5版本

3、本地模拟,减少不必要的上线流程,快速看到效果。

模拟效果:

经过多次模拟,线上运行之后的曝光率和本地模拟的情况完全一致,解决了不必通过上线,在本地模拟进行初步判断的方式,减少了或者避免了不必要的上线流程。

平台成交价分区间

通过上述方式的演进过程,在实际的在线测试中,出价能力总是稍逊于V5版本。举一个简单的例子,当平台成交价是10元的情况下,v5版本的出价维持在6元和7元,而我们的演进版本中,出价总是低于6元,为了了解具体原因进行了深入分析,这其中有两个主要的原因。

原因1:返点的问题

在实际的结算过程中,针对不同的DSP平台和广告位,我们会有不同的返点给予平台,在我们上述进行毛利额计算的情况下,是直接用平台成交价进行计算的:“平台成交价 - 媒体成交价”,但是实际上我们的毛利额应该是“平台成交价 * 返点系数 - 媒体成交价”,所以我们再次对价值函数进行了修正,如下:

价值函数= max( 归一化毛利额 * 曝光率 )

说明:在对数函数中+2的原因是,如果平台成交价10元,返点系数0.7的情况下,对数函数的底是7,value值是(7-媒体成交价),在这种情况下,当出价是6元或者7元的情况下,归一化毛利额分别是0和负无穷,这种情况下,我们永远出不到6元和7元的价格,所以+2进行了一下修正。

原因2:用总体的曝光率掩盖了不同平台成交价曝光率的差异

到目前为止,针对同一平台和广告位,所使用的曝光率是总体情况的曝光率,什么意思呢?比如出价10元的曝光率是所有平台成交价在出10元情况下的曝光数据的累积数据。但是在实际情况下,平台成交价是20元和100元的情况下,出价10元的曝光率应该是不一样的,我们犯了一个用总体掩盖了个体特性的错误。

为了解决这个问题,我们针对不同的平台成交价,计算不同平台成交价下不同出价的曝光率,解决前后的曝光率计算方式如下所示:

解决前:

解决后:

Acho que você gosta

Origin blog.csdn.net/chenzhiang1/article/details/128866799
Recomendado
Clasificación