Sistema de recomendación y gráfico de conocimiento

Como un medio importante de filtrado de información, el sistema de recomendación personalizado es uno de los métodos más efectivos para resolver el problema de la sobrecarga de información en la actualidad, y es la tecnología central de los productos de Internet orientados al usuario.

Recomendaciones del sistema de tareas y dificultades

 De acuerdo con la predicción de diferentes objetos, sistemas de recomendación general, se pueden dividir en dos categorías: una es la puntuación predicha (predicción calificación), por ejemplo, en las aplicaciones de tipo película, las necesidades del sistema para predecir la opinión del usuario sobre la película, y como pueden gustar basado en empuje Pelicula Bajo este escenario información de retroalimentación del usuario expresa la extensión de las preferencias del usuario, por lo que esta información también se llama retroalimentación explícita (retroalimentación explícita) y la otra es la predicción CTR , por ejemplo, aplicaciones (click-through) rateprediction noticias, El sistema necesita predecir la probabilidad de que el usuario haga clic en ciertas noticias para optimizar el plan de recomendaciones. Comentarios de los usuarios en este escenario sólo puede expresar características de comportamiento de los usuarios (clics / no haga clic), pero no refleja la magnitud del usuario del favorito, por lo que esta información también se conoce como retroalimentación implícita (realimentación implícita).

El sistema de recomendación tradicional solo usa la información de interacción histórica (retroalimentación explícita o implícita) de usuarios y elementos como entrada, lo que traerá dos problemas: Primero, en escenarios reales, la información de interacción de usuarios y elementos es a menudo muy escasa ( escaso) . Por ejemplo, una aplicación de películas puede contener decenas de miles de películas, pero las películas clasificadas de un usuario solo pueden promediar docenas de películas. El uso de una cantidad tan pequeña de datos observados para predecir una gran cantidad de información desconocida aumentará en gran medida el riesgo de sobreajuste del algoritmo ; en segundo lugar, para los usuarios o elementos recién agregados, porque el sistema no tiene su información de interacción histórica , no puede ser precisa Modelado local y recomendación, esta situación también se llama problema de arranque en frío (problema de arranque en frío).

 

Una idea común para resolver el problema de dispersión y arranque en frío es introducir cierta información secundaria como entrada en el algoritmo de recomendación . La información auxiliar puede enriquecer la descripción de usuarios y elementos y mejorar la capacidad de extracción del algoritmo de recomendación, compensando así de manera efectiva la escasez o la falta de información interactiva. La información auxiliar común incluye:

  • Redes sociales : un usuario está interesado en un artículo, y sus amigos también pueden estar interesados ​​en el artículo;

  • Atributos de usuario / elemento : los usuarios con los mismos atributos pueden estar interesados ​​en el mismo tipo de elementos;

  • Información multimedia como imágenes / video / audio / texto : por ejemplo, imágenes de mercancías, avances de películas, música, títulos de noticias, etc.

  • Contexto : la información de tiempo, lugar y sesión actual de la interacción usuario-elemento.

  • ......

La forma de integrar eficazmente la información auxiliar en el algoritmo de recomendación de acuerdo con las características de los escenarios de recomendación específicos siempre ha sido un punto candente y difícil en el campo de la investigación de los sistemas de recomendación .

Gráfico de conocimiento

Entre todos los tipos de información auxiliar, el gráfico de conocimiento como un tipo emergente de información auxiliar ha atraído gradualmente la atención de los investigadores en los últimos años. Un gráfico de conocimiento es una red semántica , donde los nodos representan entidades o conceptos , y los bordes representan varias relaciones semánticas entre entidades / conceptos . Un gráfico de conocimiento se compone de varios triples (h, r, t), donde h y t representan el nodo principal y el nodo de cola de una relación, y r representa la relación.

La tríada que se muestra en la figura anterior expresa el hecho de que "Chen Kaige dirigió Farewell My Concubine", donde h = Chen Kaige, t = Farewell My Concubine yr = Director.

El gráfico de conocimiento contiene ricas asociaciones semánticas entre entidades y proporciona una fuente potencial de información auxiliar para el sistema de recomendaciones. El gráfico de conocimiento tiene el potencial de aplicarse en muchos escenarios recomendados, como películas, noticias, atracciones, restaurantes, tiendas, etc. En comparación con otros tipos de información auxiliar, la introducción del gráfico de conocimiento puede hacer que el resultado de la recomendación tenga las siguientes características :

  • Precisión (precisión). El gráfico de conocimiento introduce relaciones más semánticas para los elementos, que pueden descubrir profundamente los intereses del usuario;

 

 

  • La diversidad (diversidad). El gráfico de conocimiento proporciona diferentes tipos de conexiones de relaciones, lo que conduce a la divergencia de los resultados de las recomendaciones y evita la limitación de los resultados de las recomendaciones a un solo tipo;

  • Interpretabilidad (explainability). El gráfico de conocimiento puede conectar los registros históricos del usuario y los resultados de las recomendaciones, mejorando así la satisfacción del usuario y la aceptación de los resultados de las recomendaciones y mejorando la confianza del usuario en el sistema de recomendaciones.

Vale la pena mencionar aquí la diferencia entre el gráfico de conocimiento y los atributos del elemento . Los atributos del elemento pueden considerarse como un nodo de 1 salto directamente conectado a un elemento en el gráfico de conocimiento, es decir, una versión debilitada del gráfico de conocimiento . De hecho, un gráfico de conocimiento completo puede proporcionar una relación más profunda y de mayor alcance entre los elementos, por ejemplo, "Adiós mi concubina" -Leslie Cheung-Hong Kong-Liang Chaowei- "Asuntos infernales". Debido a que el gráfico de conocimiento tiene dimensiones más altas y relaciones semánticas más ricas, su procesamiento es, por lo tanto, más complicado y difícil que los atributos del elemento.

 

En términos generales, el trabajo existente que puede introducir el gráfico de conocimiento en el sistema de recomendaciones se divide en dos categorías:

  • Métodos genéricos basados ​​en características representados por LibFM [1] . Dichos métodos toman uniformemente los atributos de los usuarios y elementos como entrada para el algoritmo de recomendación. Por ejemplo, LibFM registra todos los atributos de un usuario y un elemento como x , y luego hace que la fuerza de interacción y ( x ) entre el usuario y el elemento dependa de todos los elementos primarios y secundarios del atributo:

        Con base en la versatilidad de este tipo de método, podemos debilitar el gráfico de conocimiento en atributos de ítem y luego aplicar este tipo de método. Por supuesto, las deficiencias de este enfoque también son obvias: no está diseñado específicamente para gráficos de conocimiento, por lo que es imposible utilizar de manera eficiente toda la información de los gráficos de conocimiento . Por ejemplo, este tipo de método es difícil de utilizar el conocimiento de múltiples saltos, y es difícil introducir información de relación (relación).

  • En PER [2], MetaGraph [3 ] representado por la método de recomendación basada en la ruta de acceso (métodos basados en el camino). Tal mapa métodos conocimiento como información de la red heterogénea (red de información heterogéneo), entonces, según las características meta-camino o configuración meta-gráfico entre los artículos. En pocas palabras, la meta-ruta es una ruta específica que conecta dos entidades, como "actor-> película-> director-> película-> actor" Esta meta-ruta puede conectar dos actores, por lo que puede considerarse como uno Una forma de aprovechar la posible relación entre los actores. Ventaja de estos métodos se utilizó en su totalidad y el conocimiento intuitivo de la estructura de red del mapa , la desventaja es la necesidad de diseñar manualmente meta-ruta o Gráfico-Meta , que en la práctica es difícil alcanzar una óptima; al mismo tiempo, estos métodos no pueden hacer que no pertenecen entidad Se usa en escenas en el mismo campo (como recomendación de noticias) porque no podemos predefinir meta-path o meta-graph para tales escenas.

Gráfico de conocimiento de aprendizaje de características

Knowledge Graph Embedded aprende un vector de baja dimensión para cada entidad y relación en el gráfico de conocimiento, mientras mantiene la estructura original o la información semántica en el gráfico. De hecho, el patrón característico del conocimiento está aprendiendo función de red para aprender un sub-campo (red de incrustación), debido mapa de conocimiento contiene información semántica específica, mapas de conocimiento tienen que aprender que las características generales de la red de una necesidad de aprendizaje a ser más cuidadoso y el diseño del modelo de destino. En términos generales, los modelos de aprendizaje de características del gráfico de conocimiento se clasifican en dos categorías:

  • Modelos traslacionales basados ​​en la distancia . Este tipo de modelo utiliza una función de puntuación basada en la distancia para evaluar la probabilidad de triplicar, y trata el nodo de cola como el nodo principal y el resultado de la traducción de la relación. Los representantes de tales métodos incluyen TransE, TransH, TransR, etc.

  • Modelos coincidentes basados ​​en la semántica. Este tipo de modelo utiliza una función de puntuación basada en similitud para evaluar la probabilidad de triplicar, mapear entidades y relaciones en un espacio semántico oculto para la medición de similitud. Los representantes de tales métodos son SME, NTN, MLP, NAM, etc.

Debido a que el aprendizaje de características del gráfico de conocimiento obtiene un vector de baja dimensión para cada entidad y aprendizaje de características, y mantiene la estructura y la información semántica del gráfico original en el vector, un buen conjunto de vectores de entidad puede representar total y completamente el Interrelaciones, porque la mayoría de los algoritmos de aprendizaje automático pueden manejar fácilmente entradas de vectores de baja dimensión. Por lo tanto, utilizando el aprendizaje de características del gráfico de conocimiento, podemos introducir fácilmente el gráfico de conocimiento en varios algoritmos del sistema de recomendación . En pocas palabras, el aprendizaje de características del gráfico de conocimiento puede:

 

  • Reduzca la alta dimensionalidad y heterogeneidad del gráfico de conocimiento;

  • Mejore la flexibilidad de la aplicación de gráficos de conocimiento;

  • Reduzca la carga de trabajo de la ingeniería de características;

  • Reduzca la carga computacional adicional causada por la introducción del gráfico de conocimiento.

     

En este artículo, presentamos el sistema de recomendación, el gráfico de conocimiento y el valor de aplicación del gráfico de conocimiento en el sistema de recomendación. Como información auxiliar del algoritmo de recomendación, la introducción del gráfico de conocimiento puede mejorar en gran medida la precisión, diversidad e interpretabilidad del sistema de recomendación. En el artículo de la próxima semana, detallaremos las diversas ideas e implementaciones para introducir el gráfico de conocimiento en el sistema de recomendaciones, ¡así que estad atentos!

 

Referencias

[1] Máquinas de factorización con libfm

[2] Recomendación de entidad personalizada: un enfoque de red de información heterogénea

[3] Fusión de recomendaciones basada en metagramas en redes de información heterogéneas

[4] Incorporación de gráficos de conocimiento: una encuesta de enfoques y aplicaciones

Publicó 150 artículos originales · elogió 149 · 810,000 visitas

Supongo que te gusta

Origin blog.csdn.net/chaishen10000/article/details/102703527
Recomendado
Clasificación