" En este trabajo, Baidu y Alipay recomiendan dos experiencias prácticas relacionada con el sistema, el modelo para el desarrollo de la industria hacer un simple tipo de revisión, cubren la expresión de aprendizaje, el aprendizaje profundo, aprendizaje por refuerzo mapas de conocimiento y de aprendizaje multi-tarea ."
Representa el aprendizaje y el aprendizaje profundo sistema de recomendación de aplicación es relativamente madura de la industria, pero con el aprendizaje por refuerzo , mapas de conocimiento , el aprendizaje multi-tarea de la combinación es relativamente pequeño, por un lado, y la combinación recomendada de estas tecnologías está empezando a explorar, detrás hay demasiados temas que necesitan mano de obra para la minería y exploración; por el contrario en el negocio de la compañía se atreven a explorar y experimentar en estos temas a la vanguardia de alto flujo y el acceso incluso en línea, el jefe del departamento de coraje es crítica.
aprende
Las características comunes de la categoría de la representación: Uno-caliente de codificación, consulta de incrustación, Pre-Tren incrustación
marco
predecesores participación de EE.UU. grupo IIC (https://blog.csdn.net/gamer_gyt/article/details/97985818)
secuencia secuencia
Figura Graph
Información adicional de información complementaria
Marco lateral de la información es una de las maneras de resolver el arranque en frío.
multimodal multimodal
Más precisamente, esta parte pertenece a la categoría de reconocimiento de patrones, las empresas en el establo de negocios comprensión básica de los contenidos crearán un equipo independiente (al lado hay una comprensión especial del contenido del grupo en el momento de Baidu prácticas) para compartir información con el exterior Por ejemplo, el equipo de Youku ha hecho esto muy bien: "la investigación y la aplicación de Youku en el contenido de la comprensión multimodal" (https://www.infoq.cn/article/xgP_eyfidAA2l5ShcCPp).
modelo de nivel de aplicación
Esta sección detalla, se refieren a la siguiente sección.
estudio en profundidad
sistema de recomendación de la empresa con el fin de maximizar la precisión del modelo, que tienden a utilizar rico contenido, incluso datos heterogéneos. Estas características muestran información diferente de diferentes dimensiones, y la combinación entre características es a menudo muy significativa. La cruz tradicional se caracteriza por un manual ingeniero de diseño, que tiene muchas limitaciones, de alto costo, y no puede extenderse a nunca antes visto patrón cruzado. Así que los estudiosos comenzaron a estudiar con redes neuronales para aprender automáticamente las características del modo interactivo de gama alta, compensar artificial cuenta con obras provocados limitaciones.
Resumen de la recomendación de aprendizaje profundidad del sistema (basado https://coladrill.github.io/2018/08/08/%E5%9F%BA%E4%BA%8E%E6%B7%B1%E5%BA%A6%E5 % AD% A6% E4% B9 % A0% E7% 9A% 84% E6% 8E% A8% E8% 8D% 90% E7% B3% BB% E7% BB% 9F% E7% BB% BC% E8% BF % B0 /)
poco profunda sueña enlace Github (https://github.com/shenweichen/DeepCTR)
última revisión del papel (https://zhuanlan.zhihu.com/weichennote)
Fuente: https: //zhuanlan.zhihu.com/p/69050253
2015-2016
-
Haga clic convolucional modelo de predicción [CIKM 2015] Un modelo de predicción Haga clic convolucional
-
Factorización-apoyado de redes neuronales [ECIR 2016] profundo aprendizaje sobre Multi-campo de datos categóricos: Un estudio de caso sobre la predicción Respuesta del Usuario
-
Basada en el producto de redes neuronales [ICDM 2016] redes neuronales basadas en productos para la predicción de la respuesta del usuario
-
De ancho y profundo [DLRS 2016] amplia y profunda de aprendizaje para los Sistemas de Recomendación
2017-2018
-
DeepFM [IJCAI 2017] DeepFM: una factorización-máquina basada red neuronal para la predicción CTR
-
Modelo lineal por tramos [arXiv 2017] Aprendizaje Modelos lineales de Gran Escala de datos para el anuncio sabios pieza-Click Predicción
-
Deep & Cross Red [ADKDD 2017] profunda y de la cruz de la red para Ad Haga clic Predicciones
-
Atencional factorización Máquina [2017] Las máquinas IJCAI Factorización atencionales: Aprender el peso de las interacciones entre características a través de redes de atención
-
La factorización de los nervios de la máquina [SIGIR 2017] neuronal Factorización Máquinas para Escaso de análisis predictivo
-
xDeepFM [KDD 2018] xDeepFM: La combinación de interacciones entre características explícitos e implícitos para Sistemas de Recomendación
2018-2019
-
AutoInt [arXiv 2018] AutoInt: Aprendizaje automático Característica interacción a través de auto-atentos Redes Neuronales
-
Profundo interés Red [KDD 2018] profunda Red interés para el porcentaje de clics Predicción
-
Profundo interés evolución de la red [AAAI 2019] profundo interés Evolución de la red para el porcentaje de clics Predicción
-
NFFM [arXiv 2019] Operación consciente de redes neuronales para la predicción de respuesta del usuario
-
FGCNN [WWW 2019] característica de generación de convolucional de redes neuronales para el porcentaje de clics Predicción
-
Profundo interés Sesión Red [IJCAI 2019] Red profundo interés de sesión para el porcentaje de clics Predicción
-
FiBiNET [RecSys 2019] FiBiNET: La combinación de Importancia Características y función bilineal Interacción para el porcentaje de clics Predicción
la ingeniería automática Característica voy a salir del papel, deseando que llegue el ~
refuerzo de aprendizaje
interacciones estrechas continuas a menudo se producen entre el sistema de usuario y la recomendación, fortalecer los mecanismos de recompensa de aprendizaje es muy adecuado para aplicación a este modelo, es el método recomendado basado en el aprendizaje de refuerzo, el sistema de recomendación tenderá a ser visto como el agente (agente) , visto como el entorno del usuario (medio ambiente), la recomendación de los productos puede ser considerado como un clásico del problema de decisión secuencia. política de ordenamiento agente de cada elección puede ser visto como una prueba y error (ensayo y error), la retroalimentación de los usuarios, click-wrap y otras recompensas como se obtiene del medio ambiente.
Cuando Alipay práctica, más de CTR modelo de optimización, la estrategia de funcionamiento recomendada para el escenario de las líneas de negocio, lo que lleva a lograr un modelo de aprendizaje por refuerzo fuera de la política (a continuación sólo como iniciar, no de los detalles del modelo público Buha).
el acabado de papel
-
[ICDM 2018] recomendación secuencial auto-atento
-
[ArXiv 2018] aprendizaje por refuerzo para la búsqueda de información en línea
-
[WWW 2018] DRN: un profundo refuerzo del marco de aprendizaje para News Recomendación
-
[SIGIR 2019] permanente secuencial Modelado con memorización personalizado para la predicción de respuesta del usuario
-
[ICML 2019] generativo Acusatorio Modelo del usuario de la Recomendación Refuerzo aprendizaje basado Sistema
-
[2019 AAAI] a gran escala Recomendación interactivo con estructura de árbol degradado Política
-
[ArXiv 2019] Refuerzo Aprender a Engagement Optimize a largo plazo del usuario en los Sistemas de Recomendación
-
[WSDM 2019] SUP-K-Off Política de reforzar el sistema de recomendación
-
[ArXiv 2019] Refuerzo de aprendizaje para Sistemas de Recomendación basados en Slate: A tratable descomposición y Práctica Metodología
Oportunidades y Desafíos
-
Enorme brecha entre línea y los resultados de evaluación en línea
-
Generalizada problema de la simulación fuera de línea, modelando especialmente el comportamiento de toma de decisiones continua del cliente.
-
Los métodos existentes pero es todavía un montón de problemas, por ejemplo, no describe el comportamiento de la continuidad y la retroalimentación de los usuarios antes y después de la correlación no es considerado factores de retroalimentación multi-usuario detrás así sucesivamente.
-
espacio de acción es demasiado grande
-
Ante la enorme espacio de funcionamiento discreto en un sistema de recomendación real (el elemento se recomienda que sean enorme colección).
-
El problema en este artículo se ha hecho un poco de exploración, pero no ha resolver completamente este tipo de problemas.
-
susceptibles en línea al efecto de otras políticas
-
Al final, por ejemplo, se recomienda al algoritmo de uso RL, los usuarios ven un montón de otras recomendaciones en la estrategia para mostrar otras ubicaciones, hora del día, le dan una plataforma para impulsar los resultados difíciles de modelar con precisión el comportamiento atribuido a la retroalimentación de los usuarios.
-
Explora cómo hacerlo mejor
-
Debido a que la escena real no es tan rico entorno de juego de datos de la muestra, y cada vez tienen una gran exploración de los costos explícitos o costos ocultos.
-
Explorar más rápido, un mejor uso de la eficiencia es problemas de aplicación práctica RL4Rec.
Mapeo del conocimiento
Sistemas de Recomendación personalizados: Temas Hot Five de investigación que usted debe saber (https://www.microsoft.com/en-us/research/lab/microsoft-research-asia/articles/personalized-recommendation-systems/)
En la mayoría escenario recomendado, los artículos pueden contener una gran cantidad de conocimientos e información, y describir la estructura de estas redes de conocimiento para ser conocido mapa de conocimiento. conocimiento mapeo de los productos finales elementos de información ampliado en gran medida, y fortalecer los vínculos entre los elementos, tal como se recomienda proporciona una gran cantidad de valiosa, trae mejores resultados adicionales recomendados 多样性
y 可解释性
.
Y las redes sociales en comparación con el mapa de conocimiento es una red heterogénea, y por lo tanto más compleja y sofisticada para un mapa de conocimiento diseño de algoritmos de recomendación. En los últimos años, las características de la red de aprendizaje (red de aprendizaje representación) se está convirtiendo en un centro de investigación caliente en el aprendizaje automático. El método de introducción de características de la red de un proceso de aprendizaje información relevante mapa de conocimiento sistema de recomendación, ayuda a mejorar el aprendizaje de sistema de recomendación de capacidad, mejorando la precisión y la satisfacción del cliente.
Se introduce el sistema de recomendación de los conocimientos de mapeo, hay dos formas diferentes de procesamiento:
-
modelo de ayuda recomendado basado en funciones , la característica principal es la introducción del aprendizaje mapa de conocimiento. Ese patrón característico de los primeros en utilizar los conocimientos adquiridos para procesarla, lo que resulta en entidades y relaciones de pocas dimensiones representación vectorial denso. Estos representación de bajas dimensiones vector más naturalmente se puede combinar e interactuar con el sistema de recomendación.
-
Global recomienda estructura del modelo basado en las características estructurales del mapa de conocimiento un uso más directo. En concreto, el gráfico de conocimiento para cada entidad, hemos llevado a cabo BFS de múltiples saltos para conseguir sus entidades asociadas en los resultados del Gráfico de conocimiento de recomendación de derivación.
2018-2019
-
[KDD 2018] Contexto basado apalancamiento Meta-ruta de acceso para la Recomendación Top-N con A Neural Co-Atención Modelo
-
[WWW 2019] Recomendación multi-tarea de aprendizaje de funciones para el Conocimiento Gráfico Enhanced
-
[WWW] 2019 Gráfico de conocimiento convolucionales Redes de Sistemas de Recomendación
-
[KDD 2019] KGAT: Conocimiento Atención red Gráfico de la Recomendación
-
[KDD 2019] El conocimiento consciente Graph Redes Neuronales con Label Suavidad de regularización de Sistemas de Recomendación
-
[DLP-KDD 2019] La interacción basada en Barrio An End-to-End Modelo para mejorar en el conocimiento Recomendación
-
[AAAI 2019] explicables Razonamiento sobre el conocimiento Gráficos para Recomendación
-
[SIGIR 2019] Refuerzo Gráfico de conocimiento Razonamiento para Recomendación explicables
Oportunidades y Desafíos
-
Los modelos existentes son todos los modelos de aprendizaje estadístico, es decir, la minería de datos estadísticos en la red y por lo tanto inferir
-
Una más difícil pero prometedor dirección de la investigación es el razonamiento en la red, combinando el razonamiento dibujo y sistema de recomendación.
-
Cómo diseñar un buen rendimiento y alta eficiencia de funcionamiento del algoritmo, es también un potencial de direcciones de investigación
-
El modelo actual no involucra nivel de cálculo del motor, el nivel del sistema y la consideración a nivel de hardware, incluso, cómo los algoritmos y el diseño subyacente articulación superior arquitectura y optimización, es un problema urgente en la aplicación práctica de la investigación.
-
Vigente modelo de estructura de red es estática, en un escenario real, mapa de conocimiento tiene una cierta puntualidad
-
¿Cómo describir la evolución temporal de esta red, y tener plenamente en cuenta la información de tiempo en la recomendación, pero también digno de nuestra investigación futura.
En el sector industrial, por un lado, para construir una imagen necesidad de gastar enormes humana, y por otro muestreo gráfico de mano y otra tecnología relacionada no está maduro (violencia, uso de GCN, KGAT no realista). De acuerdo con el presente, he aprendido, en la aplicación del mapa de conocimiento de calidad industrial, Google y Baidu es más vanguardista (el grado de atención por parte de las necesidades de la escena cuando el índice es requisitos grandes y de alta calidad de la consulta).
Multi-tarea de aprendizaje
Sé que esta parte es relativamente pequeña, a ser el estudio de seguimiento.
-
[RecSys 2019] La recomendación de lo que el vídeo a ver a continuación: Un sistema de clasificación multitareas