Integração do fluxo de informações Taobao e atualização de serviço híbrido





O sistema de recomendação é um sistema de filtragem de informações usado para prever as preferências do usuário e filtrar conteúdo que possa interessar ao usuário de uma grande quantidade de informações para fazer recomendações personalizadas. Um processo completo do sistema de recomendação inclui principalmente nós de processamento, como recall multicanal -> conclusão de material -> classificação e filtragem fina -> classificação mista -> saída de adaptação. Como a última camada de processamento antes da saída dos resultados, o embaralhamento é usado principalmente para normalizar e classificar os resultados das recomendações de diferentes fontes.Por um lado, é para obter a sequência de classificação com o melhor efeito de recomendação para os usuários e, por outro lado, , também pode melhorar a diversidade, a personalização e o alcance das recomendações.



Status atual dos links de tecnologia


▐Link existente  


O fluxo de informações do Taobao é um sistema de recomendação típico. No fluxo de informações, existem diversos tipos de cartões de visita, como produtos, anúncios, temas de nuvem, vídeos curtos, transmissões ao vivo, etc. Dividiremos os cartões de visita em duas categorias: resultados de publicidade e resultados de recomendação natural. Na fase de classificação, dois módulos de processamento serial serão divididos em dois tipos diferentes de resultados para misturar e classificar.


Diagrama esquemático do processo de mistura do fluxo de informações pós-compra

  1. Resultados publicitários : A publicidade adota principalmente uma estratégia de exibição dinâmica de poços. Ao chamar o serviço de exibição dinâmica fornecido pela publicidade, ela decide quais poços exibir anúncios, quais resultados publicitários são exibidos especificamente e o faturamento publicitário correspondente. O objetivo da tomada de decisão é a comercialização ideal . valor. Ao tomar decisões, todos os conjuntos de candidatos recomendados serão inseridos como recursos contextuais, mas a ordem dos resultados naturais não será decidida.
  2. Resultados naturais : O processo de reorganização dos resultados naturais não utiliza o conjunto de candidatos publicitários como recursos contextuais para tomar decisões. Da mesma forma, não toma decisões adicionais sobre a classificação dos conjuntos de candidatos publicitários. Ele apenas reorganiza dentro dos resultados naturais., para obter a sequência de classificação do valor ideal do usuário.

Na sequência final de resultados de saída, os resultados publicitários serão priorizados nas vagas determinadas pelo serviço de exibição dinâmica, e outros resultados de recomendação natural serão exibidos nas vagas restantes.

▐Há um problema  


  1. As estratégias de algoritmos têm objetivos inconsistentes e não podem obter resultados ótimos globais : a estratégia de exibição de publicidade é mais baseada no valor comercial e menos consideração é dada ao valor do usuário dos resultados naturais, embora a substituição de indicadores possa ser alcançada ajustando a compensação coeficiente entre os dois. , mas obviamente não pode obter um resultado de sequência globalmente ideal.
  2. Há um alto acoplamento entre a iteração da estratégia do algoritmo e a iteração da lógica de negócios : no link atual, os estudantes de algoritmos precisam desenvolver conjuntamente o mesmo conjunto de código com os estudantes de engenharia. Ao mesmo tempo, os vários módulos de política envolvidos estão espalhados em diferentes estágios de o pipeline, como O serviço de valor ecpm de publicidade do qual o serviço de segmentação dinâmica de publicidade depende será chamado durante a fase de conclusão, enquanto os resultados reais da segmentação dinâmica serão processados ​​​​durante o agendamento misto, resultando em maior complexidade do sistema geral e maior estabilidade custos de manutenção.


▐Solução _  


Com base nos problemas acima, esperamos realizar uma atualização unificada do atual serviço de estratégia de acordo misto.O serviço atualizado deve ter as seguintes características:
  1. Ajuste do objetivo da estratégia shuffle : O serviço shuffle deve considerar de forma abrangente o valor do usuário e o valor comercial e maximizar o valor geral da página como objetivo da estratégia shuffle.
  2. Desacoplando estratégia e negócios : extraindo a lógica da estratégia combinada do link de negócios do lado do servidor e conectando-o como um serviço independente.As atualizações iterativas posteriores serão mantidas pelos colegas do algoritmo no novo serviço, e a estratégia do algoritmo será iterada. a iteração de negócios do link de engenharia, tornando mais clara a divisão do trabalho no desenvolvimento e reduzindo os custos de manutenção correspondentes.


Plano de implementação específico


▐Seleção técnica  


Este novo serviço de fusão híbrida escolhe xrec como estrutura de código. xrec é uma estrutura de negócios baseada no mecanismo gráfico tpp. A estrutura inclui principalmente as seguintes vantagens:

  1. Componentização recomendada de processos de negócios : A estrutura xrec pode abstrair os nós de negócios do link em componentes. Os desenvolvedores só precisam implementar o negócio de cada nó de acordo com as especificações de implementação do componente acordadas pela estrutura e passar um arquivo JSON de formato fixo ao organizar processos de negócios, não há necessidade de considerar a orquestração dos processos de negócios no nível do código.

  2. Otimização de desempenho de simultaneidade totalmente assíncrona : Diferente do processo de execução simplificado da estrutura TPE usada no link de engenharia original, a estrutura xrec melhora o desempenho da cena automatizando a simultaneidade multicanal e encapsulando operações de dados, e usa uma estrutura gráfica para descrever o processo de negócios , para que os usuários não precisem aprender programação simultânea, você pode obter simultaneidade segura e em grande escala.Ao mesmo tempo, serialização/desserialização de dados, conversão de dados e chamadas de serviço externas comuns são encapsuladas em operações do operador para uso, e módulos de plataforma com desempenho otimizado são usados ​​para substituir código de usuário não utilizado com desempenho aprimorado.


A estrutura xrec economiza muito trabalho aos desenvolvedores de algoritmos, mas também impõe mais restrições às regras de codificação.O processo de desenvolvimento precisa ser realizado estritamente de acordo com as regras da estrutura.


Esquema de links  


  • Solução de link de serviço misto


Com base na estrutura xrec, construímos um serviço TPP independente (xhuffle) para realizar a lógica estratégica de embaralhamento integrada de toda a publicidade e resultados naturais. O link geral do serviço é o seguinte. O serviço xhuffle chama internamente o serviço de estimativa de valor de publicidade ecpm e o modelo de valor unificado recomendado em paralelo para obter as informações de valor de publicidade e resultados naturais.O módulo de mecanismo de mistura de fusão resumirá as informações de valor de publicidade e resultados naturais e tomará decisões sobre a classificação resultados de todos os cartões., dada a posição do poço do cartão ou reordenando os cartões e, finalmente, ligando para o serviço de faturamento de publicidade para obter informações de faturamento de publicidade para os resultados de publicidade.

  1. No link de engenharia original, os módulos de serviço mistos e dependentes estão espalhados em diferentes estágios do pipeline. Após a criação de um novo serviço, a lógica relevante de mistura e classificação é integrada em um serviço independente e pode ser iterada separadamente no novo serviço, reduzindo significativamente os custos de desenvolvimento e manutenção.
  2. O modelo de valor unificado de recomendação e o serviço de estimativa de ecpm de publicidade são mantidos por recomendação e publicidade, respectivamente, e cada um é responsável por obter pontos de valor de recomendação e pontos de valor de publicidade.
  3. O módulo de mecanismo de mistura integrado é mantido e iterado em conjunto pelas partes de publicidade e recomendação.
  4. O serviço de cobrança de publicidade é mantido pelo lado publicitário. Ao chamar o serviço de publicidade EADS, a geração de strings de cobrança de publicidade é convergente dentro do serviço de publicidade para garantir a segurança da informação.

Diagrama de link geral do serviço xhuffle

Além disso, como ainda existem algumas estratégias de direcionamento de negócios no fluxo de informações pós-aquisição, como temas de nuvem, direcionamento de vídeos curtos, etc., esta parte da estratégia não foi considerada na estratégia original de arranjo misto. da segmentação de negócios, A estratégia de embaralhamento ainda pode determinar as posições dos boxes, o que fará com que esses cartões de negócios interfiram nos resultados do embaralhamento, afetando diretamente os indicadores de dados de negócios. No serviço xhuffle, fornecemos esta parte das informações do poço de negócios como uma entrada de serviço para o módulo de embaralhamento e evitamos proativamente essa parte do poço, garantindo que os resultados da mistura e os resultados do poço de negócios não interfiram entre si.


  • Plano de chamada de serviço de link de engenharia


Após a introdução do serviço xhuffle, o tempo de invocação do serviço é uma preocupação fundamental do link de engenharia upstream. A idéia básica é que, após a conclusão da pré-filtragem no estágio de classificação, o serviço xhuffle seja chamado para tomar decisões sobre os conjuntos pré-filtrados de publicidade e resultados naturais e, em seguida, a sequência final das cartas de saída seja determinada com base no embaralhamento resultados. Por um lado, isto pode evitar a tomada de decisões sobre cartões filtrados e melhorar a taxa de utilização dos boxes; por outro lado, também reduz o número de conjuntos de candidatos, o que pode reduzir até certo ponto a pressão sobre os serviços.

Aqui, propomos dois esquemas de invocação de links.

Opção 1: Dividir a fase de classificação e chamar serviços em paralelo


Como o link existente é executado serialmente na fase de ordenação, considerando a adição de uma nova chamada de serviço externo, na Solução 1, dividimos a fase de ordenação em duas fases:
  1. Estágio de pré-classificação : Este estágio realiza principalmente alguma filtragem de cartão de pré-classificação. Após obter a sequência de cartões pré-filtrados, inicie chamadas paralelas ao serviço de embaralhamento e demais serviços externos do link de engenharia.
  2. Estágio de pós-classificação : Neste estágio, a sequência de cartas será classificada e truncada com base nos resultados do embaralhamento para determinar a sequência final de cartas que precisa ser adaptada para saída.
Diagrama de link de engenharia do Esquema 1

这种并行调用的方式看似减轻了链路RT的压力,实际上引入了一个新的问题。排序阶段输入的候选集序列大小一般是数倍于最终排序输出的序列大小,例如在购物车场景,每次请求最终返回的卡片序列数量为20,而排序阶段输入的卡片序列数量一般可达到100。在原有链路中,工程链路其他处理过程只会承接最终确认好顺序的20张卡片。如果将这部分处理前置,即使经过了前置过滤,这部分的服务实际承接的卡片序列数量还是将增长三至四倍,无形中加重了下游服务的压力。

在这部分外部服务中,UMP导购券后价接口的问题比较突出,这主要是因为UMP接口限制了接口一次调用承接的卡片数量不能超过15个,超出数量限制就需要分批发起多次调用,原本承接20张卡片就需要发起两次调用。如果承接的卡片数量增多,那么会直接增加对下游服务的请求量。

在前期小流量验证阶段,我们发现在实验流量上,对UMP服务接口的调用QPS增长了约3倍左右,这一现象也符合我们上述对该方案的分析。在小流量实验上并不能暴露出QPS增长带来的具体问题,但是如果采用这种方案进行推全,全量后下游的UMP接口将承载入口流量六至八倍的流量,压力实在太大,并且最终输出的卡片序列数量并没有增多,这部分新增的资源消耗并不是有效消耗,而是冗余消耗。



方案二:串行调用服务


考虑到上述方案带来的冗余资源消耗问题,我们提出了第二种链路调用方案,将xhuffle服务作为整体排序阶段的一个串行模块,在前置过滤完成后,直接串行执行服务调用。
方案二工程链路示意


这种调用方式对链路的RT压力会更大,由于是串行执行,服务调用的耗时会直接体现到整体链路耗时上。为了缓解RT的压力,我们采取了以下两个方面的措施:

  1. xhuffle服务本身的链路优化。混排服务中耗时占比最大的是推荐统一价值模型的调用,在最初的方案中是通过调用外部tpp服务进行处理,目前已优化为在服务中直接进行RTP调用来处理,同时调用所需的qinfo数据直接使用商品召回的缓存数据,不用重新生成。

  2. 购后工程链路在不影响用户体验的前提下,适当放宽超时限制,以此降低端上的超时率。目前,各场景均将场景超时限制放宽50ms。


两种方案对比


优点

缺点

并行调用对链路整体的RT影响较小

将工程链路其他处理前置,会带来下游服务承接的卡片数量增长三至四倍,带来冗余的资源消耗

链路改造成本小,无冗余资源消耗

服务耗时会直接体现在链路整体耗时上,对系统稳定性的压力更大


经过综合考虑后,我们认为方案一带来的冗余资源消耗是不可接受的,最终选择了方案二作为正式的链路改造方案。


总结与展望


在进行上述的链路改造后,xhuffle服务已在购中后信息流推全,好价版信息流正在逐步接入中。经过一系列优化迭代,目前的xhuffle服务在保证了系统稳定性前提下,取得了自然&广告双涨的结果。

  链路稳定性结果


  1. 混排服务场景指标:入口场景的服务调用平均RT保持在30ms以内,P99保持在70ms以内。服务调用超时率稳定在0.5%以内。
  2. 入口场景整体的系统稳定性指标:链路整体耗时可控,整体超时率保持在0.3%以内。
  3. 端上用户体验指标:由于各场景均扩了超时RT限制,我们通过端上接口的耗时变化来反映对用户体感上的影响。从扩RT前后分端接口耗时来看,用户体感上没有明显的变化。

  未来展望


  1. 短视频、直播等业务的混排策略升级,减少业务定坑对混排的约束。
  2. 类目打散等规则化策略的融入。
  3. 建设通用化的混排服务链路接入方案,以同一套方案为更多场景提供混排策略服务。

网络包传输

淘天集团首页&信息流技术-首页团队,目前负责集团电商平台的首页和信息流推荐,其中手机淘宝首页、信息流、NewDetail等场景每天服务数亿用户,大促核心系统峰值QPS千万计,工作涉及全链路端到端性能优化,流量效率提升、用户体验、提高商家及达人参与淘宝的积极性,优化商业生态运行机制。在过去的几年时间,我们一直专注手机淘宝首页、推荐信息流核心链路业务支持和业务平台抽象,与业界领先的算法团队紧密协作,不断拓展业务边界并将核心业务指标一次次踩在脚下。
这里有巨大的流量,可以满足你对高并发大规模分布式系统练手的畅想;
这里有前沿的算法应用场景,可以玩转各种智能创新;
这里有严苛的系统指标要求,可以让你感受到优化复杂系统化的快感~


¤  拓展阅读  ¤

3DXR技术 |  终端技术 |  音视频技术
服务端技术  |  技术质量 |  数据算法


本文分享自微信公众号 - 大淘宝技术(AlibabaMTT)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

Tauri v2 支持 Android 和 iOS,跨平台开发新选择 PostgreSQL 90% 的新代码仅由 50 人完成,拓数派荣占一席 联想 2024 年将发布全新 AI OS 操作系统 微软为 Windows 11 引入原生 Sudo 命令支持 Redox OS 计划移植更多 Linux 软件 谷歌向 Rust 基金会捐赠 100 万美元,改进 Rust 与 C++ 的互操作性 曾被 Mozilla 放弃的 Web 引擎项目“Servo”在 2024 年迎来重生 Zig 编程语言 2024 年全新路线图发布 Go 语言之父总结成功因素:吉祥物功不可没 谷歌已从搜索结果页面删除“缓存链接”
{{o.name}}
{{m.name}}

Acho que você gosta

Origin my.oschina.net/u/4662964/blog/10924141
Recomendado
Clasificación