conteúdos Mushroom Rua do fluxo de informações de classificação Practice

 

REVIEW: Este acabamento do papel de Mogu DDay realizada em agosto 2019 compartilhada algoritmo relatórios de campo. Cobrindo as iterações críticos algoritmo de caminho de cogumelo conteúdo Rua córrego algoritmos de ordenação ano inteiro e, ao mesmo tempo, estamos a tomar o caminho da evolução ajuste apenas o direito de recall, caminhos de iteração típicas dos três estágios de classificação. Pela equipe de revisão especial das informações pode ser tornado público e, portanto, terminar este, esperar mais trocas com você.

introdução

 

Mushroom Rua conteúdo da home page aderindo a deixar mais pessoas foram anseio de moda e uso cogumelos Rua alvos, para fornecer aos usuários com elegante, de aparência boa, comprar valor. O slide seguinte nos dois primeiros pontos de vista tomado nosso aplicativo anteriormente adiada até três pessoas na forma de agregação de conteúdo, conteúdo para fortalecer o país na forma de cachoeiras fluir mudanças, o impacto de tais mudanças em produtos para o nosso algoritmo e arquitetura ou engenharia muito grande. O terceiro quadro é clicar sobre o conteúdo do efeito da página em tela cheia, o usuário pode apontar como, comentar, compartilhar, se você gosta do conteúdo de um único produto, também pode ser grama e comprar buy buy, continuam a declínio é surpreendente para saber mais relevante "recomendação de conteúdo."

 

 

Como será que " elegante, boa aparência, buy " transformou o nosso algoritmo para indexá-lo ? Conteúdo da Comunidade "boa aparência moda" deste problema básico solução é operações PUGC , naquela rua I apresentada ao usuário são recrutados KOL publicada através de análises operacionais, para satisfazer os critérios de selecção de conteúdo, que é quase conhecidos, pequeno livros vermelhos tal comunidade UGC abordagem conteúdo gerado é diferente.

 

Neste modo, o conteúdo do algoritmo de ordenação busca da "moda olhar bom", podemos compreender o conteúdo da força Ta , ou seja, os usuários gostam de assistir e ver muito mais para ver por um longo tempo. Continue a desmontagem Down Home indicadores básicos é muito tempo (tempo de espera) quando o conteúdo CTR (CTR) e as estadias de usuários . Outros termos é: Início exposição pv pv + + clique na página inicial clique em duas páginas estadias longas . Claro, os usuários de negócios preferem o ponto de retenção de vista, o núcleo de indicadores relacionadas ao usuário é muito importante, mas esses indicadores sobre os indicadores de um lado e de longo prazo de experimentos de curto prazo não pode ser observado, no índice de indicadores outra CTR mão + de longo prazo e de curto prazo tempo de permanência também têm alguma relevância sexo. Portanto, nós nos comunicamos com o lado do negócio dos indicadores âncora curto prazo, continuou a observar os indicadores de longo prazo.

 

Para o "buy", são os usuários de conteúdo quer ser capaz de ajudar a tirar as roupas, Tiaoyi Fu, podemos entender a força Ta de produtos , isto é, ao mesmo tempo tipo de necessidade de conteúdo para considerar o conteúdo do valor de buy buy buy. Isso nós pode ser transformado em conteúdo CVR , conteúdo e forçar o conteúdo double alta deve ser de força bens de grande valor, mas o status quo não é parte de um item relacionado, itens relacionados conteúdo grama também precisa acumular um certo estágio, e de casa para mostrar o conteúdo do conteúdo e, em seguida, clique exposição a mercadorias clique para dados CVR conectar itens relacionados diferentes a partir do fornecedor de electricidade pura anterior e fortalecer a cena do país. Além disso, a fim de tornar o negócio de pessoas ganham dinheiro, abriu um plano sub-comissão cpo mercadoria, o valor de diferentes mercadorias em consideração o conteúdo diferente ainda mais diversificado.

 

Pode-se dizer que as características do nosso negócio de serviços é: o conteúdo está associado multi-entidade ecológica, otimização multi-objetivo é nosso andam de mãos dadas . Aqui simplesmente para chamar a todo o conteúdo das diversas entidades e relações ecológicas. Da perspectiva do consumidor, entidades visíveis incluem: habitação Daren (visual gráfico até as pessoas, vídeos curtos de pessoas, viver de acordo com pessoas) e os das pessoas na plataforma para a produção de conteúdo de moda (incluindo a âncora estúdio Daren ), até as pessoas na produção de conteúdo vai escolher o conteúdo mercadoria da loja , correspondentes marca de moda , e Daren opcional rótulo de conteúdo . operadores comunitários serão tonalidade comunidade e revisão de conteúdo de todos os aspectos da marcação conteúdo e conteúdo integrado. Além disso Além disso, a comunidade irá operar em uma base regular as tags apropriadas e organização de conteúdos tema popular para o assunto do momento tem, a tendência do conteúdo temático para mostrar-se de uma forma agregada.

 

entidades gerais, Casa síntese algorítmica para incluir tipo: conteúdo de moda, o estúdio, a marca core, temas populares, e deve ser considerado no processo de ordenar a relação das entidades para alcançar as pessoas, bens, rótulo, incluindo.

 

Porque a nossa equipe também é responsável por produtos de ordenação, é inevitável que vamos pensar: Quais são as semelhanças e diferenças com o conteúdo mercadoria fluxo de pedidos de encomendá-lo?

 

O mesmo lugar é óbvia: eles são problema de programação. Sendo assim, é a arquitetura geral e programas terão semelhanças. Podemos adotar a música de duas etapas recomendadas: correspondência + Ranking . Uma vez que os conteúdos e ordenação de bens pode cair na mesma estrutura, então podemos reutilizar a experiência passada, pode, pode aprender da experiência do passado para tomar decisões em cada ponto de iteração ao longo do caminho comum evolução técnica.

 

Mas, na verdade, faz, afinal, "Almoço Não Free"! As características acima mencionadas de nosso conteúdo e toda a composição da comunidade ecológica, podemos ver que no que diz respeito à ordenação dos bens, o conteúdo do usuário provavelmente não é o mesmo que o esperado. custo de utilização do consumo de conteúdo no mesmo. Isso é um diferentes formas de negócios, indicadores diferentes que estão em causa, esse tipo de sistema de avaliação também é diferente, nossa prática de fato encontrou muitas vezes, " o mesmo caminho de execução diferentes resultados em comercial e classificar o conteúdo de " experiência .

 

Nós olhamos para o quadro corrente recomendada da indústria + Ranking marcha . O diagrama de fluxo do processo principal que emprestar YouTube na FIG. Quando um usuário solicita, combinando o candidato primeiro conjunto selecionado menor do maior piscina de material, dependendo do contexto e da história comportamento do usuário e outras cenas, em seguida, o conjunto candidato de dados integrados e comportamento do usuário classificação.

 

Igualando o caminho de evolução corrente da seguinte forma:

  1. A primeira geração é Collaborative filtragem métodos e suas variações , incluindo balanço, simrank semelhantes, é principalmente com base em regras heurísticas definir o grau de similaridade é calculada off-line e dois materiais de cada material de materiais mais semelhante, o utilizador pode clicar no Material recordar que os materiais semelhantes;

     

  2. A segunda geração de incorporação e suas variações , incluindo a incorporação de gráfico, node2vec afins, é utilizado directamente das regras e métodos que os materiais de identificação, cada modelo de material irá aprender uma representação de baixa dimensão, modelo semelhante para assegurar que o material no espaço de baixa dimensão proximidade, melhor calculado dado um material semelhante ao material por estes métodos;

     

  3. O modelo de terceira geração é o recall modelo de profundidade, incluindo dssm, YouTubeDNN, TDM, etc. , porque o segundo métodos de classe ou aprender uma representação material do mesmo, que a terceira categoria de métodos para estudar como dar-lhe um usuário direto contar quais materiais devem ser recordado, e não ser calculados de forma antecipada, como retratado capacidade e estrutura expressiva e melhor.

 

Para Ranking , onde a primeira edição de notas de empréstimo preguiçosos @ estudantes Wang Zhe acabamento, terminando sua especialização em ampla e profunda com base em várias versões do modelo, e porque nós tentar igualar o caminho é relativamente alto, como a última parte do transformador e modelagem ao longo da vida nós não conseguimos tabela de resultados on-line temporariamente. No conjunto, a evolução da indústria e nosso modelo de classificação de três gerações da mesma CTR também altamente estimado o modelo max mudança. Esse know área quase o distrito tem um monte de pequenas parceiros muito mais detalhados pentear, e, portanto, não vai repeti-los.

 

 

Nós Framework Início O conteúdo é dividido em três partes, além de uma correspondência e classificação com base da camada de visualização , incluindo: arranjo de negócios, personalizado quebrado, direitos de transferência e outros recursos personalizados, para atender o lar de muitos tipos de multi-serviço multi-entidade ajustar objetivos. Na camada de correspondência, fizemos um layout paralelo estratégia de cadeia combinado célula de fluxo e recordação vector para resolver de forma eficiente personalizado, diversidade, oportunidade de conteúdo, apoio especial e outros objectivos e requisitos de negócios. No ranking, estamos a partir LR para WideLR, tente WIDE + modelo de funda, e tentar aprender classificação multi-objetivo, em geral continuar a otimizar a eficiência de correspondência, permitindo que os usuários sejam capazes de igualar o mais adequado KOL, conteúdo e outros tópicos.

 

Na parte do recall, primeiro produto recomendações com base na idéia de implantar uma matriz paralela cadeia estratégia estratégia composta de , com base na relação entre a entidade e dimensões relacionadas pentear, associados aos dados de negócio da estação, aberta de link de dados vários cenários de negócios. Esta fase, o algoritmo procede principalmente das novas estratégias de regulação e ganhar a estratégia de recordação à ordem e proporção trazer, no mais simples e fácil de espalhar as características paralelas, resolvendo problemas de negócios cobertos. Então, a fim de reforçar ainda mais a relevância de generalização, tentamos i2i usar métodos heurísticos para substituir simrank este modelo incorporação de conteúdo , que inclui também a incorporação de método de incorporar métodos off-line e on-line , são colocados online antes e após 3 % e aumento de 5% . Finalmente, a fim de explorar o efeito fluxo razoável, considere a estratégia de recuperação para simplificar, a recomendação vídeo desde o início, procedemos com o programa de recall célula de fluxo , tendo em conta personalizado, pontualidade, diversidade, apoio especial e outros objetivos de negócio, determinação, no passado, a fim de garantir pontualidade, suporte de negócios global ponderada trazem o índice global online caiu problemas colocados online para aumentar o efeito de 4% ; com base nisso, continuamos a tentar diminuir a longa cadeia de piscina política tráfego personalizado personalizado originais agilizar, para substituir as dezenas de recall originais de estratégias podem não ter em conta as dimensões de cada questões de propriedade através da maneira modelo de profundidade, o dssm + incorporar efeito em cadeia final com a política original inalterado , que seguem ainda mais otimizada pelo modelo de recordação abre um novo capítulo para nós .

 

 

Em áreas de classificação, em primeiro lugar, recomendamos encomendar bens usando a idéia clássica de que recursos densas mais LR maneira simples , pensando rápido nesta linha, eo recurso pode ser reutilizado ligação recall. Ao mesmo tempo, começamos com o modelo global de negócios alvo pentear conteúdo, com base CTR aumento do modelo de longo tempo de residência , inicialmente através de novas funcionalidades e modelos que também trouxe longa estadia, mas porque o crescimento CTR traz. Depois de determinar os principais indicadores do longo tempo de residência, começaremos uma longa estadia quando adicionado aos objectivos de optimização do modelo, por amostras reweight modelo WIDE com base na sua introdução na função objetivo, trazendo longo elevador 7% da estadia . Na estrutura do modelo, desenho práticas Shopping por grande escala seqüência comportamento fora de linha cruzada apresenta LR , trouxe uma linha melhoria de 20% ; estender ainda mais o modelo para armazenar mais bem sucedido modelo Ampla + funda , on-line trazem melhoria de 2% , que também precisa combinar as características de negócio em casa e continuar a explorar e experimentar.

 

 

Tem alguma experiência em todo o processo da prática de compartilhar com todos, com respeito aos detalhes do modelo de algoritmo, o ponto mais importante é:

 

A tarefa importante a maioria, isto é, dados e log RBI ponto enterrado, enterrado corretamente e razoavelmente ponto é extremamente importante, em tempo real apresenta RBI anormal útil . Este é o produto, cliente, back-end, controle de qualidade, o número de armazéns, BI, bem como a participar no algoritmo, trabalho complexo trivial.

 

Segunda prioridade, é construir produtos baseados em características morfológicas de amostras e modelos selecionados, afinal, como Free Lunch Não . A importância do produto e interação podemos entender, que são baseados em características do produto ao modelo; e feedback experiência do usuário é oportuna, o feedback do usuário, e valorizar cada júnior perguntas de feedback parceiro.

 

Terceira prioridade, que a arma onde investir, comunicação eficaz e consenso exige uma compreensão de questões de negócios e estudantes de negócios para alcançar depois, é claro, neste processo, para determinar as prioridades para resolver qualquer problema de negócios, o modelo pode explicativo particularmente importante, em suma, ainda temos de ter em mente o número de pontos na sua própria posição e valor.

 

Finalmente, o trabalho acima, My Street resultado de esforços conjuntos de equipes de trabalho recomendada. do conteúdo do comentário algoritmo de classificação Ao longo do ano, as equipes podem ser dito para fazer em nós principais alcançaram melhores resultados e objetivos de negócio, em apoio de mais de 30 equipe de transporte de alta intensidade pode continuar a funcionar enquanto a tecnologia iterativo e crescimento multi-facetada. Embora existam alguns arrependimentos e defeitos de, mas acredito que estes irão conduzir-nos a ir mais longe no futuro! ~ ~ Artigo acabado

Publicado 363 artigos originais · Louvor obteve 74 · vista 190 000 +

Acho que você gosta

Origin blog.csdn.net/sinat_26811377/article/details/104584523
Recomendado
Clasificación