Visão geral do modelo de correspondência busca recordação recomendado no (a): O método tradicional

Visão geral coincide com o modelo recomendado busca Part0

A principal fonte de inspiração desta revisão papel desliza SIGIR2018 de "Deep Learning for Matching em Pesquisa e Recomendação", centra-se na busca e profundidade correspondência recomendado na revisão muito sólida para alguns métodos que, em particular, com base em funcionalidades do abordagem de aprendizagem profunda acrescenta algum papel relacionado recente. Pesquisar e sistema de recomendação deve ser a aprendizagem de máquina aprendizagem profunda e até mesmo landing na indústria das cenas mais usadas e mais facilmente realizados. Quer se trate de uma pesquisa ou recomendação, de fato, essencialmente, combinando a essência de uma determinada consulta de pesquisa, doc correspondência; recomendada é a natureza de um determinado usuário, o item recomendado. Este artigo sublinha o problema de correspondência sistema recomendado, incluindo o modelo tradicional correspondência e modelo de aprendizagem profunda.

Embora a aprendizagem profunda do vento se intensificou, mas a idéia por trás da decomposição da matriz incorporada, filtragem colaborativa, etc. Na verdade, o pensamento foi executado por eles, como pensar userCF e itemCF de svd ++ encarna o modelo FM essência pode degenerar em mais de maioria dos modelos. Não mais do que resumir esses métodos, contribuir para uma compreensão mais profunda de associações entre diferentes modelos.

A Figura 1 é recomendado e a natureza da pesquisa, é o processo de jogo

Parte 1 baseado Método de filtragem Collaborative

modelo CF

Falando sistema de recomendação no modelo mais clássico, que o famoso filtragem colaborativa. filtragem colaborativa é baseado em uma premissa fundamental: o comportamento de um usuário, e ele pode ser previsto pelo comportamento dos usuários similares.

A idéia básica de filtragem colaborativa baseia-se no <usuário, item> de todas as interações, usando a sabedoria coletiva para fazer recomendações. CF podem ser divididos em três tipos de acordo com o tipo, baseados em usuário CF, item- baseado CF e FC baseada em modelos

(1) CF-base de usuários: por meio de análise do item favorito do usuário, se os usuários de e item b teve quase como, os usuários a e b são semelhantes. Da mesma forma amigo, como, b pode ser apreciado, mas não leu o item uma recomendação a um

(2) CF item de bases: ponto A e ponto B, se a pessoa é quase como que produto A e do produto B são semelhantes. Se os usuários como item A, em seguida, o item recomendado ao usuário uma alta probabilidade B é como. Por exemplo, este artigo apresenta ao usuário navegar através do sistema de recomendação também é provável que preferem outras máquinas e sistema de recomendação de artigos relacionados de aprendizagem semelhantes.

CF (3) Modelo de bases: também chamado método à base de aprendizagem para descrever a relação entre o utilizador e o artigo, o utilizador e o utilizador, e o artigo definindo um modelo paramétrico do artigo, e, em seguida, através dos utilizadores existentes - optimizar a matriz do artigo de pontuação resolvendo parâmetros GET. Por exemplo matriz de decomposição, e o modelo semântico como LFM escondido.

CF Collaborative filtragem problema a ser resolvido pela ideia expressa na estrutura de dados é: desconhecido como problemas de enchimento matriz parciais (Matrix Conclusão). Mostrado na Figura 2.1, é um valor conhecido do item que o usuário interagiu, como preencher a matriz com base nesses valores conhecidos restantes valor desconhecido, isto é, para prever o usuário não tem interagido item é preenchido problema matriz a ser resolvido.

Figura 2.1 usuário avaliou filme do lado esquerdo, o direito pode ser preenchido com uma expressão de matriz

Matriz pode ser preenchido com um SVD clássica (Singular Value Decomposition) solução, como mostrado na Figura 2.1

2,2 SVD FIG decomposição da matriz.

Em que M = m * n à esquerda representa a matriz de pontuação do utilizador, as linhas e m matriz representa o número de utilizadores, o símbolo n representa o número de colunas de Item matriz, na maioria dos sistemas de recomendação maiores do que o tamanho de m e n, que é desejável para decompor M em por formar na classificação inferior direito. Geralmente resolução SVD pode ser dividido em três etapas:

(1) dados em falta matriz cheia com o M 0

(2) resolver o problema SVD, matriz U e V para se obter matrizes

(3) utilizando as matrizes U e estimativa da matriz V k-dimensional baixo-rank

Para a segunda etapa para resolver o problema da SVD espécie, equivalente ao seguinte problema de otimização:

Em que o utilizador i Yij verdadeiro produto pontuação j, etiqueta ou seja, U, e V são as estimativas do modelo, a solução de matriz de processo de U e V é verdadeiro para minimizar a matriz de pontuação erro do utilizador e a matriz do processo de predição.

Há um problema de método de solução que SVD:

(1) falta de dados (conjunto de dados foi responsável por mais de 99%) e observar dados como o peso

(2) processo de minimização sem regularização (apenas o desvio mínimo), com tendência para overfitting

Portanto, em geral, para o método SVD originais haverá muitas melhorias.


modelo MF (decomposição matriz)

A fim de resolver o acima descrito sobre-montagem, o modelo de decomposição da matriz do modelo (fatoração matriz) foram a seguir

A idéia central do modelo MF pode ser dividido em duas etapas

(1) o utilizador u i marcados itens utilizador escondido decompostos em vectores de Vu, e um artigo escondido vi vetor

(2) o produto escalar do vector e o utilizador u i do valor obtido artigo (produto interno), pode ser usado para representar o grau de preferência de um utilizador u i do artigo, quanto maior a pontuação representando o item recomendado ao utilizador maior a probabilidade

Ao mesmo tempo, MF modelo introduz l2 regularização para resolver overfitting

Claro, aqui, além de um l2 regulares, L1 outros meios regulares, como regularização regular, cross-entropia também é possível.


modelo FISM

Ambos os métodos e métodos mencionados-CF modelo MF são simplesmente usar item de informação interativo pelo usuário, a expressão é para seu próprio ID de usuário do usuário é o próprio usuário. KDD 2014 apresentado em um método mais capaz de expressar informações do usuário, fatorados item modelo de similaridade, referido FISM, por definição, o usuário gostei do item como expressão do usuário para descrever os dados do usuário é representado pela seguinte fórmula:

Observando de utilizador vectores de expressão implícitas não são independentes, mas com todos os itens gostou do utilizador foi expressa como a soma cumulativa do utilizador; o produto em si um outro conjunto de vi implícito vector é expresso, os mesmos dois últimos vectores representação produto interno.


modelo SVD ++

modelo CF MF pode ser visto como um modelo com base no utilizador, a ID de utilizador directamente mapeados no vector implícito, e modelo FISM pode ser visto modelo como um CF Item- base, mapeado para um conjunto de utilizadores domésticos implícito vector pagar o item. A informação é em si um ID de usuário, um usuário no item interagiram passado de informações, base pelo usuário e como combinar as vantagens de ambos próprio item-base dele?

método SVD ++ é a combinação dos dois, a seguinte expressão matemática

Em que cada utilizador expressa dividido em duas partes, à esquerda representa vu vector implícito mapeamento de ID de utilizador (CF pensamento com base no utilizador), o direito é a soma de interacção do utilizador ao longo de um conjunto de item (Item- baseado CF pensamento). Usuário e item de similaridade é expressa pelos cliques vetor.

Este método de fusão pode ser visto como modelo de fusão cedo, mas o modelo com o melhor desempenho em três anos consecutivos de vários milhões de dólares Netflix recomendado jogo.


abordagem baseada em recurso Part2 genérico

O método acima descrito, se é CF, MF, SVD SVD ++, ou o FISM, basta usar a informação interactivo do utilizador e o item (dados de classificação), e por uma grande quantidade de informação não é utilizada para a informação lateral. Por exemplo, as informações do usuário em si, tais como idade, sexo, ocupação, item de informação em si lado, como classificação, descrição, informação gráfica; contexto e informações de contexto, como a localização, tempo, tempo e assim por diante. Assim, os modelos tradicionais segunda parte da conversa, é como usar esses recursos para construir o modelo em funcionalidades base.

2.3 Sistema FIG em que três módulos: um utilizador de informação, a informação de produto, informação interacção


modelo FM

O primeiro é o modelo FM famoso. modelo FM pode ser considerada composta de duas partes, como se mostra na figura 2.4, o azul modelo LR linear, e porções vermelhas das segundas funcionalidades de ordem em combinação. Para cada função de entrada, o modelo de aprendizagem requer um implícito vector de expressão de v-dimensional baixo, isto é, em uma variedade dos assim chamados incorporação em representação rede NN.

Em que o modelo de entrada de um-quente esparso 2,4 FM na FIG.

FM modelo matemático expressão mostrado na Fig. 2.5

2.5 FM modelo expressão matemática explodiu

Note-se que a parte vermelha representa as combinações de duas características de segunda ordem (não cruzar-se e as suas características), ou um cruzamento entre um vector representado pelo produto do vetor. modelo FM é um paradigma de expressão em funcionalidades modelo baseado, introduzida nos próximos vários modelos pode ser visto como um exemplo especial do modelo FM.


modelo FM e as relações MF

Se a ID do utilizador e ItemID única, podemos encontrar que degenerado em FM mais MF viés modelo, como mostrado na FIG 2.6.

FIG modelo 2.6 FM pode degenerar em um modelo com uma polarização de MF

expressões matemáticas são os seguintes:


modelo FM e as relações FISM

Se a entrada contém duas variáveis ​​1) o conjunto de produto através de interacção do utilizador; 2) itemId-se, então, neste caso, por sua vez degenerada em FISM FM viés modelo de banda, tal como mostrado na figura 2.7, as caixas são azuis histórico do usuário item de interagiu (filmes classificados), à direita das caixas de laranja representam uma características de um quentes itemId si

Figura 2.7 modelo FM pode degenerar em um modelo com uma polarização de FISM

Neste momento, modelo matemático FM expressa da seguinte forma:

Da mesma forma, se juntamente com o ID do utilizador implícito vector de expressão, em seguida, o modelo FM degenerar em modelo SVD ++. Visível, MF, FISM, SVD ++ FM são realmente um caso especial.


resumo Part3

perspectiva micro

Modelo apresentado acima são resolvidos pela previsão de pontuação sistema de recomendação de problemas de agendamento, que em muitos casos geralmente não são os melhores, porque há os seguintes aspectos:

fosso (1) com uma pontuação previsto de métricas RMSE e os indicadores de ordenação sistema recomendação real

ajuste RMSE com o resultado previsto é a variância mínima (com regular), e os rostos reais de um problema de programação

(2) observações de polarização que ocorrem naturalmente

Os usuários geralmente tendem a marcar o seu ponto favorito, mas o usuário não marcar o item não tinha realmente não gosto. Para o sistema de recomendação de agendamento, geralmente pode ser substituído por um RMSE pares classificação

Como mostrado na equação acima, o utilizador não está directamente montada na pontuação individual do item, mas sob a forma de par de encaixe; Em geral, o item do utilizador alta pontuação> item de utilizador baixa pontuação; interacção do utilizador item usado> o usuário não tem interagido item (não necessariamente realmente não gosto)


perspectiva macro

Na verdade, a natureza da pesquisa e recomendação estão combinando, combinando com ex-usuários e itens; o último consulta correspondente e doc. Específico para o método de correspondência, dividido entre o modelo tradicional e da profundidade do modelo em duas categorias, o segundo capítulo fala do modelo tradicional, capítulos terceiro e quarto falando sobre o modelo de profundidade.

Para o modelo tradicional eo modelo é dividido no modelo baseado em recurso baseado em filtragem colaborativa, a maior diferença entre os dois é se o uso de informações lado. Baseado modelo filtragem colaborativa, tais como CF, MF, FISM, SVD ++, utiliza apenas o utilizador - elementos de informação, tais como a interacção ID do utilizador, itemId, e um conjunto de interacção do utilizador sobre o item si expressa. Os modelos baseados em recursos com FM, por exemplo, a principal característica é, além de o usuário - além de objetos interativos, também introduz informação lateral adicional. modelo FM é um caso especial de muitos outros modelos, como o MF, SVD ++, FISM e assim por diante.

Terminar esta revisão é baseada principalmente nos slides originais, parte leitura da porção papel do intensivo bruto, aprendi um monte deles, em texto completo com idéias sobre como fazer o jogo recomendado vai tão longe quanto possível encadear uma variedade de métodos, principalmente atrás da mesma ideia orientação. Há mais de erros, críticas bem-vindo apontou.


Part4 referência

(1) https: // www. comp.nus.edu.sg/~xiangn um / sigir18-deep.pdf

(2) Xiangnan Ele, Hanwang Zhang, Min-Yen Kan, e Tat-Seng Chua. fatoração de matriz rápido para a recomendação em linha com feedback implícita. Em SIGIR de 2016.

(3) Yehuda Koren e Robert Bell. Os avanços na filtragem colaborativa. sistemas de recomendação manual. Springer, Boston, MA, 2015. 77-118.

(4) Santosh Kabbur, Xia Ning, e George Karypis. FISM: modelos item de similaridade fatorados para top-n Sistemas de Recomendação. Em KDD 2013.

(5) Yehuda Koren. Fatoração encontra o bairro: um modelo de filtragem colaborativa multifacetada. Em KDD 2018.

(6) Steffen Rendle. Fatoração máquinas. Em ICDM de 2010.

Publicado 18 artigos originais · Louvor obteve 588 · Visualizações 1,03 milhão +

Acho que você gosta

Origin blog.csdn.net/hellozhxy/article/details/103979806
Recomendado
Clasificación