algoritmo de 600 millones de usuarios de recomendación musical NetEase nube

NetEase música nube es un lugar de reunión para los amantes de la música, la nube sistema de recomendación de música dedicados a caer por los algoritmos de IA, personalizado recomendación mil caras de miles de clientes, con el fin de traer una experiencia diferente de escuchar la música.

Esta se centra en el intercambio de aplicación práctica de los algoritmos de IA en recomendaciones de música, así como los retos y las soluciones encontradas en el proceso de algoritmo de aterrizaje.

Expandir a partir de dos partes como sigue:

  • La aplicación de algoritmos de IA en las recomendaciones de música en
  • AI pensar en la escena musical

A partir de abril 2013 lanzó formalmente hasta el momento, la plataforma de música Netease nube sigue ofreciendo significativa: comunidad de música de la pantalla, UGC (contenido generado por el usuario) sola canción, así como servicios de recomendación precisos, la trama fuera del programa de música, mire en vivo, y el ancla de la plataforma sección.

usuarios registrados actualmente la música de la nube tienen 6 millones, y ganó la primera posición continuado en las listas de música en la clase de aplicaciones.

La aplicación de algoritmos de IA en las recomendaciones de música en

Música recomienda escenario de aplicación práctica, utilizamos técnicas de IA para distribuir canciones y lista de canciones. Las aplicaciones más típicas son: canciones diarias y FM privada, que se pueden personalizar según la escena, para hacer recomendaciones relacionadas con la pista.

La figura es un diagrama lógico de todo nuestro sistema de recomendación de música, incluyendo varios secuencia de registro, ETL, características, recuperar, clasificar y recomendaciones finales.

Para el sistema de recomendación, la más importante es la manera de entender el retrato del usuario, es decir, mediante la integración de datos front-end a entender qué tipo de usuarios de la música como el hormigón.

Como se muestra en la figura:

  • En la capa de datos, se utilizó principalmente la colmena, Hadoop, Flink, SparkSQL y Mammut.
  • En el nivel de aprendizaje de máquina, que entonces utilizó el SparkML, Tensorflow, parámetro Server y Caffe.

Lo anterior es un sistema de datos de construcción tabla de comparación, que sistema incluye la construcción de algoritmos para la construcción del sistema del usuario, que es el entorno de aplicación nube de música algoritmos de IA.

Nuestro equipo se divide en:

  • Experiencia de datos del equipo
  • Artificial equipo de algoritmos de inteligencia
  • Personas de la oficina central
  • miembros relacionados con la empresa

Cuando se trata de la utilización de la inteligencia artificial en la forma recomendada, de recomendación de música y otras materias primas tienen diferentes lugares. Por ejemplo:

  • Que podemos decir en un corto tiempo de sus propias preferencias, por lo que podemos hacer docenas vestido de exploración era de 10 segundos. Pero la música es la necesidad de tomar el tiempo a la experiencia, a menudo una canción de haber escuchado a 10 segundos o más, sólo para descubrir que no es nuestra preferencia. Así, la música no está mirando directamente se puede entender, se recomienda en el proceso de elaboración del producto, la experiencia del usuario debe estar orientada a la apreciación real de la música en sí.
  • A menudo se visten por unidad de tiempo sólo puede ser consumido de una vez, pero la gente puede desplazarse a través de las listas de reproducción, y el modo de un solo ciclo, escuchar en repetidas ocasiones a la música en una unidad de tiempo. Así que este es un comportamiento del consumidor repetible, que deben aprovechar esta recomendación al hacer las leyes.
  • Como el costo de consumo de música es relativamente alta, tenemos que centrarnos en la experiencia del usuario, y la presencia del usuario en su proceso de consumo, fuerte tiempo tiene relevancia. Al mismo tiempo, si se permite a los usuarios escuchar 10 segundos de una canción, 30 segundos y 60 segundos, lo que significa para ellos, su expresión es diferente. Por lo tanto, tenemos que proporcionar un consumidor verdaderamente significativo, de modo que estos reflejan la relevancia de consecuencias conductuales eficaces.
  • Cómo pesar del sistema de recomendación de música pros y los contras? Es para investigar al usuario utilizar la longitud de la plataforma de tiempo? O para ver el número de pistas de música en su colección de Favoritos? Por supuesto, hemos encontrado que algunos usuarios no hacen clic en forma de corazones a cualquier colección de canciones. Este último a través del intercambio, descubrimos que en realidad simplemente no les gusta las canciones directamente a su propia atracción encuentro sólo el negro. Podemos ver que es difícil medir el efecto de un único sistema de recomendación de música objetivo.

Veamos cómo plataforma de música en nube es la aplicación de la tecnología de AI:

① la complejidad de la música

Dada la complejidad de las cuestiones relacionadas con la música se ha mencionado anteriormente, ¿cómo hemos de entender la música? En nuestra plataforma, para la música diferente, tiene una gran cantidad de UGC, así como una amplia gama de los comentarios de los usuarios de calidad.

Por lo tanto, podemos utilizar estos comentarios y conciencia para una sola canción, el uso de dos vías bi-ISTM, para generar una cierta declaración descriptiva de la música.

Entonces, cuando se introduce la nueva música, podemos basados ​​en menos lenguaje relacionado con el desarrollo de una nueva descripción interpretativa.

Como puede observarse, por ejemplo, hay un "contra-corriente del río", la canción, con muchas título de la canción sola relacionado y la descripción a continuación.

Podemos añadir palabras clave para restaurar una variedad de marcas de palabra, y producir música para las características relevantes de la descripción de la persona.

Sobre esta base, que luego filtro basado en el vocabulario artificial, como de forma automática genera: "Red de niña china", "canciones populares de Hong Kong" y otras frases.

Por lo tanto, en virtud del sistema de PNL (procesamiento del lenguaje natural), somos capaces de visualizar la frase final de la canción.

Toma esto, para la comunidad de usuarios, no pueden apuntar a abrir incluso escuchar una canción, puede escribir generalmente aprendido la canción pertenece.

En segundo lugar, podemos utilizar "+ video + imagen de convolución" tecnología relativamente sencilla de entender la música.

Por ejemplo, para algunas de las canciones más populares, se utiliza la expresión que se ha generado, y la asociación existente, y luego obtener el audio asociado, identificar la similitud entre las canciones volumen, ritmo, estilo y música, a la música. " retrato ".

Repita el valor de consumo de música ②

Aquí se refleja principalmente en la recomendación de música CF. Como puede observarse, hemos encontrado que mediante el seguimiento: una escucha usuario a la canción A 10 veces, 9 veces escuchar la canción B y C sólo escuchar la canción 1 veces.

Entonces podemos similitud Relevancia A, B, C se entienden de la siguiente manera: las preferencias del usuario en las categorías A y B canción un poco más, y la correlación entre A, B también más grande.

En consecuencia, basándose en la frecuencia tal de los usuarios de repetición de consumo, podemos establecer la relación entre X, Y, Z eje de coordenadas, para expresar la posición del espacio entre ellos, así como las diferencias en la dirección espacial.

Obviamente, con este cálculo una similitud, se mejorará significativamente nuestra eficiencia para todo tipo de recomendación de música.

costos de consumo de altas ③ la música, las características de alta correlación antes y después, hay más requisitos para expresar las necesidades de los usuarios modelo apropiado

Como se muestra arriba, hemos experimentado un modelo lineal desde el modelo de árbol, a gran escala FTRL, entonces la profundidad de las redes neuronales, y finalmente a la profundidad de la red de temporización, proceso iterativo aspectos de tal un musical recomendado.

En primer lugar, se parte del modelo de RL. El modelo explicativo LR fuerte para nosotros elegir. Sin embargo, a pesar de sus explicativas más fuerte, y más rápidas iteraciones, pero su expresión es muy limitada.

Más tarde, vamos al modelo de árbol. RF y el modelo de tener un modelo como LGB: pueden resolver parte no lineal explicar la ventaja, por supuesto, tiene el inconveniente de que las necesidades de ajuste a fortalecerse.

Entonces, pusimos en marcha a gran escala adecuada para la expresión de FTRL. Las ventajas: se caracteriza por el tipo de memoria, una temporización basada en el aprendizaje y la formación anterior, y representa la expresión de todas las características asociadas con.

La desventaja es la relativamente grandes características de latitud, a saber: Para las diferentes necesidades de diferentes empresas, el tamaño de muestra requerido será más, será más complicada la cantidad de cálculo.

Con el fin de aumentar las capacidades de seguimiento, se utiliza la profundidad de la red neuronal, incluyendo: DNN, DeepFM y Wide y modelo de Deep-peer.

Su ventaja es muy teórico, pero la desventaja es: debido a la complejidad de la red neuronal en sí, por lo que Interpretabilidad relativamente pobre, no pueden aprender todo tipo de relación temporal implícita.

Por último, se utilizó la profundidad de la temporización de la red, el modelo correspondiente incluye: LSTM, GRU Transformer, DIN y dein, sus ventajas es la capacidad de aprender diferentes características de tiempo y, además, tiene la capacidad para retratar + generalización.

Por supuesto, también son inconvenientes con la profundidad de las redes neuronales se ha mencionado anteriormente, a saber: la red es interpretabilidad más complejo, pero relativamente pobre.

Aquí echamos un vistazo a los modelos de RL y árboles. Hemos dicho anteriormente, las características de los modelos lineales y los árboles son: categoría estadística / clase cuenta generalización es muy rico, pero relativamente poca capacidad de generalización.

En el escenario de la canción, nos podemos directamente relacionada con la canción, una gran cantidad de datos generados por el comportamiento de un usuario, proporcionada al modelo.

Por el algoritmo, necesitamos todo tipo de música a etiqueta de índice abstracto. Sin embargo, a pesar de que tenemos más que suficientes recursos y las muestras de conducta de música, pero debido a las secuencias de acción con frecuencia no son lineales, así que en vez habíamos encontrado un ajuste, y cuenta con viajes en el tiempo (es decir, funciones de memoria) temas.

Es urgente través de la línea y la consistencia característica de línea a utilizar eficazmente los datos de comportamiento diferente al contexto de aprendizaje, y por lo tanto mejorar la capacidad de ajuste del modelo.

Por lo tanto, con el fin de mejorar la capacidad de adaptación, que es el primer intento modelo de DNN. DNN por relu conectado estructuralmente a la baja con el fin de asegurar que toda la combinación de características y combinaciones de características de alto orden, pero también los resultados en el número global de expansión.

Por lo tanto, mejoró a DeepFM, es posible combinaciones de orden simultáneamente inferiores de características y combinaciones de características de la orden superior modelando es posible aprender la relación entre el orden de combinación de características. Como se mostró anteriormente, también introdujo a finales de DCN.

DCN puede explícitamente el aprendizaje de orden superior características interactivas. Podemos llevar esto a capturar con eficacia cruzadas características no lineales.

Como los restos de la modelo DeepFM, podemos controlar eficazmente la expansión del vector, de modo que los parámetros espaciales a ser reducidos.

En lo anterior, también mencionado el problema de la expresión de la asociación temporal. En este sentido, una vez vino DIN (Deep Red interés) para el porcentaje de clics.

En diversos puntos de interés en la atención al usuario, DIN en los que afectarán el comportamiento histórico recomendación actual. Sin embargo, la norma DIN no puede ser capturado por los usuarios cambiar dinámicamente el tipo de intereses musicales.

Por ejemplo, un usuario que se utiliza para como la música electro-acústica, y más tarde cambió a una balada de amor. Así como la "evolución" es la norma DIN no puede ser capturado.

Sobre esta base, nos cambiamos a la profundidad de interés en la evolución del modelo de red (DIEN). Las principales características de este modelo son: la evolución, centrándose en el interés del usuario en el sistema, el interés en el diseño y la capa de abstracción de capa de la evolución.

Utiliza la nueva red y los resultados de la modelización en forma de, más precisamente a los cambios de interés del usuario en la expresión, y la evolución del proceso de sincronización.

Para obtener más control detallado de los cambios interés de los usuarios, que también se utiliza el modelo DSIN. DSIN se compone principalmente de dos partes: una característica es escasa, el otro es una secuencia de procesamiento de comportamiento del usuario.

El modelo es capaz de encontrar un usuario en la misma sesión, las similitudes están navegando mercancía, y en diferentes sesiones, las diferencias están navegando mercancía, y luego se extrae la sincronización de interés del usuario.

④ en el consumo de música, dada la complejidad de las necesidades del usuario, es difícil medir los méritos de un sistema de recomendación de música solo objetivo

Aunque el sistema de recomendación es una aplicación típica de las estadísticas, pero las estadísticas sólo se puede resolver el problema del 95%, el 5% restante se relacionan con aspectos de la preferencia personal.

A menudo nos encontramos con varios problemas en las aplicaciones prácticas, entre ellas: la relación entre el CTR (Click-Through-Rate, CTR) y la duración del consumo no es elevación sincronizada, a veces incluso mostrando una tendencia del cambio. Entonces, ¿cómo podemos resolver el problema de la misma multi-objetivo?

Para el problema multi-objetivo, tenemos muchos tipos de soluciones para elegir. Como puede observarse, son las siguientes: peso de la muestra, la pérdida de peso, y parte de la red compartida. Por lo tanto, hemos adoptado un entrenamiento conjunto de objetivos múltiples, esta sencilla aplicación.

En la figura anterior, en primer lugar en la capa de red asegura la salida y para lograr representación compartida superficial. Por lo tanto, el efecto del entrenamiento, aunque hay algunas diferencias entre el objetivo, pero como hemos introducido un entrenamiento de la red discrepancia, la tasa de recogida y la duración del consumo se han mejorado significativamente.

, Formación conjunta visible de ventajas:

  • En poco profundas representan compartida por múltiples objetivos y tareas, le añadimos los datos de ruido entre las tareas. Esto no sólo reduce la red exceso de montaje, sino también mejorar la generalización de los resultados.
  • En la tarea multi-objetivo de aprendizaje, estamos en diferentes tareas por tener diferentes ubicaciones mínimos locales, y puede interactuar con la ayuda de escapar de los mínimos locales.
  • Multi-objetivo a través de la misión de formación conjunta, por lo que el modelo lo más posible a la solución óptima para resolver común multitarea.
  • Uso "tapping" de manera similar a realizar un seguimiento de la colección de música del usuario para otras operaciones, y luego hacer juicios apropiados.

Revisar otros tipos de recomendación de música y los puntos recomendados de diferencia mencionamos en el artículo anterior, hemos logrado lo siguiente punto a punto solución:

  • Diferencias: Basado en la complejidad de la música en sí, ¿cómo entendemos los recursos de la música? Solución: el uso PNL, video y tecnología de imagen para comprender mejor la música.
  • Diferencias: el consumo y el consumo repetible no puede ser diferente de la repetición. Solución: características de consumo de uso de la música, para analizar de forma inteligente la correlación entre las diferentes canciones.
  • Diferencia: el alto costo de todo tipo de música no sólo el consumo, sino también antes y después de que existe una correlación clara. Además, el significado de la conducta eficaces tienden a ser más abundante. Solución: Usando sofisticada modelo de AI para explorar la relevancia de la secuencia de canciones de usuario.
  • Diferencias: difícil de usar un único objetivo, para medir el efecto del sistema de recomendación de música. Solución: MTL uso de la tecnología, para hacer frente a la diversidad de necesidades de los usuarios.

AI pensar en la escena musical

Así que ¿por qué tiene la escena musical AI lo necesita? Está claro que ahora no es el pasado que mediante la compra de CD, poner fin a la era de las canciones del álbum.

Con cientos de millones de usuarios en nuestra plataforma de recomendación de música. Ellos están en un diferentes estados de ánimo, que se enfrentan con más de diez millones de pieza de música generada por más de 100.000 músicos necesitan para conseguir un buen estado de ánimo de buena música.

Podemos decir sin exagerar que: "era de Internet de los auriculares es tubo de oxígeno, mientras que la música es oxígeno."

Por lo tanto, lo que necesitamos en un espacio de 4 dimensiones, resolver un problema complejo juego. Y esta es la inteligencia artificial entra en acción.

Recomendado por el sistema basado en IA, estamos en condiciones de seguir proporcionando una fuerte capacidad de cola larga para explorar y capacidades de adaptación precisa, y luego al mismo tiempo y mejorar la experiencia del usuario, para promover su intercambio voluntario de canciones y descubrir más recursos en la plataforma de música Netease nube.

Para lograr el objeto anterior, hemos establecido una configuración de sistema como se muestra en la figura. Específicamente incluye los siguientes aspectos:

  • sistema modelo mental del usuario. Ellos incluyen: conductual, cognitiva y actitud.
  • sistema de investigación del usuario. Ellos incluyen: cuestionarios de la encuesta.
  • Sistema de Análisis de Casos. Ellos incluyen: análisis de usuarios, grupos de usuarios y el comportamiento de uso.
  • Sistema de evaluación. Incluyendo: tasa de recogida, la velocidad de la canción, así como la longitud y el otro uso.
  • sistema de retroalimentación de datos. Incluyendo: colección, canciones de corte, como el positivo y el voto negativo a la izquierda.

A través de ellas la experiencia del usuario cualitativa y cuantitativa sistema de evaluación, usamos mapas de conocimiento, aprendizaje estadístico, y las formas de aprendizaje para fortalecer la combinación, para construir un modelo de sistema de tres niveles de la siguiente manera:

  • sistema de clasificación. Incluye: clasificación de modelo, el modelo ee, modelo y tendencias de la moda.
  • sistema de juego. Incluye: el comportamiento de los modelos recomendados, así como un nuevo modelo de descubrimiento de contenido.
  • sistema de datos. Incluir: datos de comportamiento de los usuarios, retratos, retratos y contenido.

Por esto, mantenemos al tanto de los conocimientos relacionados con los datos de los usuarios, así como el conocimiento experto con el fin de mejorar mejor las plataformas de relevancia y aceptación del usuario.

Publicado 18 artículos originales · ganado elogios 588 · Vistas 1,03 millones +

Supongo que te gusta

Origin blog.csdn.net/hellozhxy/article/details/104009328
Recomendado
Clasificación