Exploración y práctica del algoritmo de recuperación de recomendaciones musicales QQ

1. Introducción comercial

1. Introducción comercial

Hay muchos productos recomendados en la página de inicio de QQ Music, como: estación de radio personalizada, 30 canciones por día, recomendación de una sola canción, recomendación de lista de reproducción UGC y lista de reproducción AI, etc.

imagen

En la imagen de arriba, puedes ver que cada producto tiene características y formas diferentes. Por ejemplo: las estaciones de radio personalizadas brindan una experiencia auditiva inmersiva; las listas de reproducción de algoritmos de IA actualizan 30 canciones todos los días. Estas diversas formas de productos plantean muchos desafíos para los algoritmos y arquitecturas de recomendación. Los objetivos de optimización y las estructuras de muestra de diferentes portales morfológicos son diferentes.

2. Características de la escena de recomendación de música QQ

A continuación, presentamos algunas características de los escenarios de recomendación de música QQ.

En primer lugar, a nivel de usuario, la plataforma cubre una gama muy amplia de consumidores, tanto jóvenes como mayores.

inserte la descripción de la imagen aquí

En segundo lugar, los atributos inherentes del grupo objetivo son relativamente escasos. Excepto por el retrato de la música en sí, otros atributos solo tienen una pequeña cantidad de información demográfica completada por los usuarios. A nivel de comportamiento, es decir, el nivel de interacción de los usuarios, terminar y cortar canciones son los principales comportamientos operativos, así como otras operaciones como favoritos, bloquear, seguir y agregar listas de reproducción de creación propia.

Finalmente, a diferencia de los escenarios de comercio electrónico y transmisión de video, el consumo repetido de música es una característica importante de los escenarios de recomendación de música. Además, los productos recomendados por la música son diversos y las características de las diferentes formas son muy distintas, por ejemplo, el audio, la letra, el cantante, etc. de la canción, el título y la imagen de la lista de reproducción UGC, etc.

Los escenarios recomendados anteriormente presentan los siguientes desafíos para el algoritmo de recuperación:

Cuando el usuario escucha música, el ruido es relativamente grande. Si las muestras no se procesan y analizan cuidadosamente, la precisión de la recuperación no es lo suficientemente buena.

La popularidad de la cabeza es muy grave, en términos relativos, si no se hace una intervención específica, los resultados de la recomendación carecerán de sorpresa.

Los atributos de usuario son escasos y el arranque en frío es relativamente difícil.

3. Solución de recomendación de música QQ

En base a los tres problemas anteriores, proponemos las siguientes soluciones:

Recuerde usar el gráfico de conocimiento de música de fusión;

Introducir el recuerdo de secuencias y de intereses múltiples;

Minar la forma de recuperación de audio para recordar canciones con "sonido similar" para los usuarios;

Explore el método de aprendizaje federado para resolver el difícil problema de la escasez de atributos de usuario.

Estos esquemas se describen en detalle a continuación.

2. Recordatorio del gráfico de conocimiento de Fusion Music

En primer lugar, se presenta la recuperación del gráfico de conocimiento de fusión. Esta parte es principalmente para mejorar la precisión de la recuperación.
inserte la descripción de la imagen aquí

La música en sí contiene muchos atributos básicos, por ejemplo, casi todas las canciones tienen álbum, cantante, género e idioma. Para mejorar la precisión de la recuperación, muchos modelos de recuperación incorporarán estos atributos en el modelo como Side-Info de la canción para el aprendizaje, y también se utilizan modelos como EGES/GraphSage en la recuperación de QQ Music. Sin embargo, estos dos tipos de modelos también tienen deficiencias, por ejemplo, el modelo EGES puede integrar Meta información, como el idioma, álbum, etc., mencionados anteriormente, el aumento de esta característica hará que la generalización del recuerdo sea insuficiente, la ecología de Douyin también penetra en la lógica metaasociativa de muchas canciones. Además, la biblioteca de música de QQ Music es muy grande y rica. El período de entrenamiento para usar algunos modelos gráficos complejos es relativamente largo, y la eficiencia también depende en gran medida de las capacidades de ingeniería. Por lo tanto, la recuperación de gráficos de conocimiento se combina a continuación, y se hace un compromiso entre estos dos aspectos, hay un buen efecto.

inserte la descripción de la imagen aquí

La música tiene un rico gráfico de conocimiento, generalmente triplicado. Por ejemplo, Jay Chou cantó Dongfengpo, una canción de estilo chino. En comparación con las características de la canción, el mapa contiene información y relaciones más ricas, y la relación se puede transmitir. Tomando la lista de reproducción autoconstruida como una muestra de entrenamiento como ejemplo, es decir, la introducción del mapa en la imagen de la derecha es equivalente a una serie vertical de canciones que ocurren simultáneamente en diferentes listas de reproducción.

inserte la descripción de la imagen aquí

Modelada utilizando el método Song2vec, la función objetivo se muestra en la figura anterior. Se puede ver que sobre la base de Song2vec, se agrega el aprendizaje de relaciones, donde el factor gamma indica el grado en que la relación actual se puede integrar en el modelo.

Hay muchas maneras de construir triples. Usando el mapa de género como ejemplo, hay dos métodos de construcción (songid1, género(género), canción2) y (songid1, relación, género(género)). El primero es un método de construcción común en PNL, pero en la escena musical, esta relación es mutua, y 2 N (N-1) pares de relaciones se construyen por producto cartesiano; mientras que la última relación es más directa, el número de relaciones cae directamente al nivel de N. El gráfico de conocimiento de fusión tiene una gran mejora en la precisión de recuperación, y la mejora de la tasa BadCase también es muy significativa. Tomando como ejemplo "Today" de Quan Zhilong, el lado izquierdo solo está asociado con Song2vec, que estará fuertemente ligado a las canciones populares de Douyin; mientras que la fusión de Song2vec y TransE en el lado derecho puede asegurar la asociación de canciones Precisión y alguna generalización.

3. Recordatorio de secuencias y multiinterés

Recordatorio de secuencias y multiinterés, principalmente para extraer las características temporales y espaciales de la secuencia, así como la representación multiinterés de los usuarios.

Después de realizar algunas mejoras en las funciones de muestra y la estructura del modelo, el modelo de YouTube tiene un efecto de recomendación muy bueno en la recuperación. La tasa de finalización de canciones de este canal de recuperación es muy alta, pero también hay muchos problemas. P.ej:

  • Pregunta 1: Existe una relación de secuencia entre el comportamiento de escucha del usuario, especialmente en la escena recomendada, además de la información de ubicación, también incluye la influencia temporal del comportamiento, es decir, existe una relación de tiempo y espacio al mismo tiempo. tiempo;

  • Problema 2: el método de agrupación promedio/suma en la secuencia es demasiado tosco, especialmente en el caso de los intereses de muchos usuarios, lo que hará que los intereses de los usuarios se neutralicen o incluso se eliminen.

inserte la descripción de la imagen aquí

A continuación, la mejora y la práctica de los problemas anteriores se presentarán por separado del modelado de secuencias y el modelado de intereses múltiples.

3.1 Esquemas de modelado espacial y temporal

QQ Music adopta el modelado de secuencias SASRec para modelar el comportamiento de transmisión histórico del usuario, extraer información más valiosa y superponer múltiples mecanismos de autoayuda para aprender transformaciones de funciones más complejas. La idea principal es usar la secuencia L del usuario para predecir su objetivo Target P. En la capa de autoatención, V calcula el peso de atención en función de QK y luego lo ingresa a la red subsiguiente, y finalmente usa sampled_softmax_loss para realizar una clasificación múltiple. para la predicción. Además de la fusión de la posición absoluta y el tiempo relativo, la incrustación compartida de entrada y salida de elementos, en comparación con el modelo de Youtube, el indicador HR @ 100 se ha mejorado considerablemente. Basado en SASRec + Share Embedding, que integra modelos de tiempo y ubicación, el resultado puede lograr una precisión del 23,72 %, mientras que el Youtube original es del 21,25 %, y la precisión aumenta en un 2,5 %.

inserte la descripción de la imagen aquí

3.2 Esquema de extracción multiinterés

En la escena musical de QQ, más del 80 % de los usuarios escuchan más de dos géneros y más del 47 % de los usuarios escuchan canciones en más de dos idiomas. Es muy importante cómo desenterrar con mayor precisión los múltiples intereses de los usuarios en escuchar canciones, e incluso el interés en escuchar canciones de pequeños grupos.

Tomando como ejemplo el modelo MIND, el modelo de intereses múltiples tiene varios módulos muy importantes, tales como:

La primera parte es que Context/demographic es un módulo que integra información contextual e información estadística como edad, género y ciudad;

La segunda parte es el extractor de múltiples intereses, un módulo de extracción de múltiples intereses basado en secuencias de usuario, que también es el núcleo del modelo. MIND utiliza la red de cápsulas para la extracción de múltiples intereses. A diferencia de las neuronas ordinarias, la entrada de ambos y la salida son vectores en lugar de escalares;

La última parte es el módulo de servicio en línea, que se divide en múltiples vectores de interés para la recuperación de vecinos en línea. Cada conjunto de índices es un grupo de interés de un usuario, es decir, se utilizan diferentes incrustaciones de usuario para indexar los diferentes grupos de interés de los usuarios en línea. .
inserte la descripción de la imagen aquí

Cuando probé el modelo por primera vez, encontré algunos problemas, como:

El efecto de agrupamiento de la incrustación de canciones no es muy bueno;

El grado discriminativo de agrupación de vectores de interés del usuario no es suficiente.

También hicimos algunas optimizaciones para estos dos problemas:

  • Optimización 1: Para el problema 1, sobre la base de Songid, agregue el idioma, el género y otros datos de las canciones terminadas para empalmar, minimice el costo del aprendizaje del modelo y dígale explícitamente al modelo que los grupos de algunas canciones son similares.

  • Optimización 2: Para el problema 2, en la segunda capa, es decir, los parámetros de la capa de enrutamiento dinámico, los logits de enrutamiento se actualizan reinicializando cada nueva muestra. De esta manera, se ha mejorado significativamente la agrupación de canciones Embedding. , y MIND, combinados con sideinfo y los métodos de enrutamiento DR modificado, pueden lograr un resultado del 25,2 % en el indicador Hitrate@200, lo que es una mejora muy obvia en comparación con las dos primeras líneas de base de múltiples intereses.

inserte la descripción de la imagen aquí

3.3 Método de representación multiinterés basado en la Autoatención

Además del uso de la red de cápsulas de MIND para la extracción de múltiples intereses, actualmente existen métodos de representación de múltiples intereses basados ​​en la autoatención en la industria. La diferencia radica principalmente en el tipo de neuronas, cómo se asignan los pesos y cómo se actualizan los pesos. Como se puede ver en la siguiente figura, la probabilidad de distribución del peso de la red de cápsulas de la figura de la izquierda está normalizada entre todas las cápsulas de la capa anterior; en la figura de la derecha, cada cabeza de atención procesa su entrada de manera independiente.

inserte la descripción de la imagen aquí

También hemos hecho muchos intentos de extraer intereses múltiples basados ​​en la atención propia. El experimento descubrió que el modelo de intereses múltiples basado en la atención propia puede describir bien las preferencias de los usuarios en diferentes géneros e idiomas, y la popularidad promedio recomendada. también es relativo a la retirada de Youtube se ha aliviado. La imagen de la izquierda es una captura de pantalla de las 30 canciones de un usuario por día. Basado en múltiples intereses, se extrajeron tres intereses del usuario: popular en mandarín, popular en inglés y popular en japonés. En el experimento AB, la finalización de la transmisión y la mejora de la recopilación son más evidentes. Tomando 30 canciones por día como ejemplo, la DAU aumentó en un 2%; las tasas de penetración total de transmisión y colección aumentarán en más de 2 puntos; la diversidad de idiomas y géneros también aumentó en 3 puntos.

imagen

La introducción de este método también ha resuelto algunos problemas en la parte superior de las canciones. Alrededor del 2% de la popularidad ha disminuido y el problema de la recomendación popular también ha mejorado.

4. Recuperación de audio

La recuperación de audio es un método de recuperación más característico para escenas musicales, que se explicará en dos partes.

4.1 Método de minería de funciones de audio

Para las canciones en la biblioteca de música, en base a cuatro categorías de detección de atributos, como voz pura, música instrumental pura, voz con acompañamiento y otros, y diez detecciones de género, como rock, folk, country, etc., para caracterizar el versión de una canción Y género, es decir, versión y género. Específicamente, tomando 3 segundos como un párrafo, para cada valor propio de 14 categorías, tome puntajes T a lo largo del eje de tiempo y calcule los valores estadísticos, incluidos el máximo, el mínimo, la media, la varianza, la curtosis y la asimetría. Sobre la base de estas 14 categorías, se extraen las funciones de audio de la derecha y las funciones de audio son las representaciones de audio correspondientes (vectores de audio).

imagen

inserte la descripción de la imagen aquí

Hicimos algunos análisis experimentales y obtuvimos algunas conclusiones: la imagen superior izquierda es la distribución de las nuevas canciones recomendadas para los usuarios con inicio en frío, y la imagen superior derecha es la distribución de las canciones favoritas correspondientes a la población de usuarios, calcular la tasa de finalización del frío. -iniciar nuevas canciones y el audio de las canciones favoritas del usuario El coeficiente de correlación de Pearson entre las similitudes (el método de cálculo específico se enumera a continuación), podemos ver que la figura inferior izquierda está en línea con la distribución normal, encontramos que el audio la similitud ponderada incrustada entre las canciones y los activos del usuario está relacionada con la tasa de finalización de la escucha de las canciones por parte del usuario. El coeficiente de correlación se ajusta a una distribución normal, lo que hasta cierto punto indica que los comportamientos de escucha de algunos usuarios son sensibles al audio (r_value > 0).

Según la conclusión del análisis anterior, la incrustación de audio también se utiliza en la recuperación de múltiples escenas de la recomendación de un solo musical QQ. Por ejemplo, el uso de la similitud de audio para la recuperación de un solo punto mejora la sensación de sorpresa del usuario y el comportamiento de recopilación del usuario ha aumentado significativamente. Hace un tiempo, el popular Leave The Door Open de Martian Brother recordó canciones como Peaches o Walk on Water a través de la similitud de audio. La extracción de representaciones de audio de canciones también ayuda en la distribución de arranque en frío en ausencia de otra información sinérgica.

imagen

En el arranque en frío de la nueva canción y la recuperación del lanzamiento de la canción, QQ Music usa el vector de audio para procesar la preferencia de audio del usuario y la representación de audio de la canción, usa la representación de audio de la canción para recordar las canciones candidatas y luego usa la preferencia de audio del usuario como una función para clasificación Obtuve muy buenos resultados.

4.2 Método de recuperación de audio multimodal

Todos los métodos descritos anteriormente se basan en la representación de audio puro. ¿Es posible combinar el comportamiento del usuario para el aprendizaje de métricas? A través de la práctica, proponemos el método de modelado User-Audio Embedding. La parte del usuario es la incrustación del usuario de 40 dimensiones calculada utilizando el modelo profundo. El modelo en la parte de audio usa una canción que le gusta al usuario y n canciones que no le gustan al usuario, y realiza un aprendizaje métrico con la incrustación de usuario de 40 dimensiones. El modelo de parte de audio entrenado puede obtener incrustaciones de 40 dimensiones para cualquier entrada de audio. En comparación con la incrustación de audio simple mencionada anteriormente, la incrustación de audio del usuario que integra la información del usuario ha mejorado aún más la precisión de recuperación del audio, que también está en el país, el rap/hip-hop/K-pop en los Premios MIREX. las tres clasificaciones de género ha alcanzado los mejores resultados de la historia. El modelo User-Audio Embedding también ganó el premio MIREX, y el artículo se publicó en ICASSP. Los estudiantes interesados ​​pueden buscar este artículo.

imagen

5. Recordatorio de aprendizaje federado

5.1 Método de recuperación de aprendizaje federado

El aprendizaje federado es una técnica de aprendizaje automático que entrena algoritmos entre múltiples servidores o dispositivos perimetrales distribuidos con muestras de datos locales sin intercambiar muestras de datos, protegiendo la privacidad de los datos. En los últimos años, con el auge del aprendizaje federado, ha habido muchos casos exitosos de modelado conjunto en el campo de las finanzas y otros campos. También hemos comenzado a buscar introducir el aprendizaje federado vertical en el ecosistema de Tencent para mejorar la precisión de la recuperación. .

Hay tres categorías de aprendizaje federado:

  • El aprendizaje federado horizontal se trata principalmente de la similitud o el mismo negocio. Se caracteriza por características superpuestas, y lo principal que se debe hacer es la combinación de muestras;
  • El aprendizaje federado vertical es principalmente para alcanzar la similitud de los usuarios, que se caracteriza por una gran cantidad de usuarios superpuestos;
  • El aprendizaje de transferencia federado es principalmente para combinar funciones, los usuarios y los servicios no son similares, y la superposición entre las funciones y los usuarios es relativamente pequeña.

imagen

En la escena musical de QQ, buscamos el aprendizaje federado vertical para caracterizar aún más las características de los usuarios. QQ Music combinó los datos del sistema de otros escenarios comerciales para entrenar conjuntamente el modelo DSSM de doble torre; QQ Music Tower contiene atributos relacionados con las canciones, incluidos el idioma, el cantante, la versión, etc.; mientras que otras torres de sistemas comerciales incluyen principalmente atributos de usuario, preferencias de interés del usuario, etiquetas de interés, etc.

En el servicio en línea, Qyin Tower produce la incrustación de elementos, y otras torres de sistemas empresariales producen la incrustación de usuarios; la incrustación de elementos se utiliza para crear un índice y la incrustación de usuarios se predice a través del servicio en línea en tiempo real para realizar una consulta de vecino.

imagen

5.2 Esquema de actualización de aprendizaje federado

La siguiente figura es un modelo multiobjetivo con dos torres.QQ Music simplemente actualizó el modelo basándose en el modelo de recuperación de dos torres, que se puede combinar con el modelado de escenarios multinegocios. El modelo MMoE se utiliza para aprender objetivos múltiples. El lado izquierdo es el lado del usuario, y se presentan diferentes Expertos para el aprendizaje; el lado derecho son los datos comerciales de diferentes escenarios comerciales, incluido el lado del artículo de QQ Music y el lado del artículo del negocio X. Este aprendizaje conjunto puede integrar los atributos y características de diferentes dominios en el modelo y luego aprender las representaciones de los usuarios con mayor precisión. La introducción del aprendizaje federado ha mejorado mucho los datos de arranque en frío del usuario, como: radio personalizada, 30 canciones por día y módulos individuales, etc. Los datos de arranque en frío de estas entradas se han mejorado significativamente y la duración media de frío -el inicio es de alrededor del 10% de mejora significativa. Debe enfatizarse aquí: el aprendizaje federado protege completamente la privacidad del usuario. TME sigue estrictamente las leyes y regulaciones relevantes, sigue el principio de protección de la privacidad y brinda a los usuarios servicios más seguros y confiables.

imagen

6. Sesión de preguntas y respuestas

P1: ¿Cómo se realiza la muestra de recuperación de música? ¿Cuáles son las diferencias entre la selección de muestras y los ensayos de secuenciación y por qué?

R: En la escena musical, hay muchas entradas. La distribución de muestra de cada entrada es muy diferente, o la distribución de características es diferente. Por ejemplo, la distribución de usuarios y las características de las 30 canciones por día son muy diferentes a las de la estación de radio. Este problema también se mencionó al principio, por lo que para la clasificación, las muestras en el lado de clasificación se optimizan para cada punto individual. Entonces, las muestras aquí son las muestras del punto en sí. El recuerdo es un modelo de recuerdo compartido por todas las entradas, por lo que para el modelo de recuerdo se utilizan los datos del mercado grande, es decir, los datos generales de QQ Music se utilizan para un entrenamiento unificado.

La ventaja de esto es que los datos serán relativamente ricos y se puede aprender información de diferentes círculos. Para las muestras de recuerdo profundo, las muestras de secuencias terminadas son más utilizadas y también incluyen características demográficas, así como alguna información de colección. Este no es el caso de las muestras en el lado clasificado.

De lo que acabo de hablar es de la selección de muestras de recuperación para modelos profundos. Para la recuperación ordinaria de un solo punto, esta parte se trata principalmente de cómo construir un modelo gráfico. En la actualidad, el establecimiento del modelo gráfico utiliza principalmente la lista de reproducción creada por el usuario. Esta parte de los datos puede contener miles de millones de datos. Basado en la co-ocurrencia de canciones en la lista de reproducción y la interacción entre canciones y usuarios, una muy Se puede construir un modelo gráfico grande. Una vez que se construye el modelo gráfico según el método anterior, se pueden usar varios modelos gráficos para caracterizar los nodos.

P2: ¿Cómo equilibrar la duración y los intereses de un usuario en la escena musical?

R: En primer lugar, la entrada del modelo de recuerdo profundo en sí es una secuencia a largo plazo. Esta parte de la secuencia de interés es una descripción del comportamiento auditivo general del usuario durante un período de tiempo relativamente largo. Esta parte de la caracterización es relativamente a largo plazo; la recuperación de un solo punto es la recuperación de I a I, que está relacionada con el comportamiento de reproducción reciente del usuario, que puede ser un comportamiento relacionado a corto plazo. Por ejemplo, los cantantes favoritos recientes de un usuario en este día o dos días se considerarán como el fuerte interés reciente a corto plazo del usuario, y usarán este interés como el siguiente para enviar más canciones con audio similar que puedan gustar, o Decir sinergia canciones parecidas etc

Por lo tanto, si se utilizan como dimensión los intereses a corto y largo plazo, un enfoque es utilizar un modelo de secuencia profunda, que se centra más en los intereses a largo plazo, y el modelo de recuerdo de un solo punto será relativamente a corto plazo. . Además, también crearemos retratos de los usuarios a corto y largo plazo. En función de los retratos a corto y largo plazo, se proporcionarán algunas rutas de recuperación correspondientes para satisfacer la exploración de intereses a corto y largo plazo de los usuarios. . Por supuesto, esto no solo se hace en el recuerdo, sino que también se agregan características de largo y corto plazo de los usuarios al modelo de clasificación para capturar los intereses de los usuarios. Esta parte debe fusionarse mientras se recupera y, finalmente, lograr los mejores resultados.

P3: Para el retiro de múltiples intereses, ¿cómo elegir el número de retiros para cada número de interés?

R: Hicimos un experimento en línea, en primer lugar, cómo elegir el número de cada interés. En esta parte del experimento fuera de línea, comparamos diferentes hiperparámetros para determinar el impacto de diferentes configuraciones en Hitrate. En términos generales, cuanto más K se seleccione, mejor será la diversidad; si el valor de K es demasiado grande, la precisión disminuirá. Hay varias opciones cuando está en línea, por ejemplo: ahora hay tres grupos, cada grupo recuerda 50 canciones, es decir, 150 canciones, y la asignación de cuotas a cada grupo es justa; otro enfoque es que cada grupo recuerda algunas canciones más, y luego lo ordena, truncando 150 canciones. Aquí, los clústeres más poderosos estarán expuestos y los clústeres más débiles estarán menos expuestos.

Esta parte del experimento en línea también se ha realizado, y los resultados de los tres grupos se combinan para clasificar, en lugar de asignar 50 a cada Cuota, los resultados de los datos serán relativamente mejores. Sin embargo, la participación de la distribución popular será mayor y la tasa de utilización del contenido en realidad no es tan alta. Entonces, el método actual es: a cada grupo se le asigna una cierta cuota, de modo que diferentes intereses, incluso si el peso es pequeño, tienen la oportunidad de ingresar al nivel de clasificación para una competencia justa.

Los resultados que se muestran en la sección de recuperación de múltiples intereses también se basan en este método; el efecto general también es muy bueno y múltiples indicadores han logrado una situación en la que todos ganan.

P4: Contenido relacionado con funciones de audio

R: Las funciones de audio se agregan al modelo de clasificación y las funciones de audio se utilizan ampliamente en el modelo de clasificación QQ Music. Como se mencionó anteriormente, en la escena musical, el audio es una característica clave que puede mostrar el interés del usuario hasta cierto punto.

Combinado con el análisis en el PPT, se puede ver que algunos usuarios o la mayoría de los usuarios, sus comportamientos de escucha todavía están relacionados con la información de audio. Nuestros intentos recientes en audio, ya sea que se basen en el recuerdo de similitud de audio de cantantes o en el recuerdo de similitud de audio de canciones, tienen un rendimiento muy bueno en los datos, lo que se refleja en el aumento de la tasa de recopilación. Debido a que los usuarios no están muy familiarizados con estas canciones, o ha penetrado en alguna de las lógicas colaborativas actuales, traerá más sorpresas a los usuarios.

P5: ¿Cómo es la pila de tecnología QQ Music?

R: En primer lugar, los datos de QQ Music se basan en la arquitectura de la plataforma de visualización de cálculo y análisis OLAP de ClickHouse + Superset, y luego, combinados con algunos componentes grandes de Tencent, QQ Music también ha creado algunos componentes de código abierto. Más adelante, presentaré mi propia plataforma de aprendizaje automático. En el nivel de capacitación del modelo, TensorFlow es la principal dirección de desarrollo. En términos de procesamiento de datos, se trata principalmente de lenguajes y componentes de procesamiento de big data como Hive. Se requieren habilidades como C++ y Go en el nivel de servicio general o en el nivel de servicio. Esta es también la dirección de la mayor parte del negocio de Tencent.

Supongo que te gusta

Origin blog.csdn.net/qq_35812205/article/details/123971401
Recomendado
Clasificación