Andrew Ng aprendizaje automático (16) - sistema de recomendación

prefacio

Actualmente en nuestras vidas con productos de Internet serán recomendados estarán involucrados en el sistema, tales como recomendar el sistema registrará las preferencias del usuario al navegar por la mercancía cuando la compra de Taobao, y luego recomendar el mismo tipo de bienes o sentir que usted está interesado en que, de acuerdo a navegar las noticias el historial de exploración con el tipo de contenido de recomendación de contenido de noticias para ti, esto es los sistemas recomendados tienen el sentido común.

Un sistema de recomendación basado en el contenido

1, descripción del problema
, si somos un proveedor película, tenemos cinco películas y cuatro usuarios, que requieren que los usuarios de bandas sonoras. Las tres primeras películas son historias de amor, los dos últimos son películas de acción, podemos ver que Alice y Bob parecen más inclinados al romance, mientras que Carol y Dave parecen más inclinados a las películas de acción. Y un usuario no tiene que tocar todas las películas también. Queremos construir un algoritmo para predecir cuántos puntos cada uno de ellos podría haber visto la película que no luchaban, y como base recomendada.
La introducción de algunos de los siguientes marcadores:
el número de nu representa al usuario
nm representa el número de película
r (i, j) si el usuario j a la película I Calificación por el r (i, j) = 1.
Y ^ (i, j) ^ nombre de un usuario j a la puntuación de la película I de
la evaluación total del número j mj en nombre del usuario demasiado de la película
Aquí Insertar imagen Descripción

2, el algoritmo de sistema de recomendación
, como se muestra aquí introducimos dos variables x1 representa el grado de películas románticas (romance), x2 representa el grado de movimiento de la película (película de acción)
Aquí Insertar imagen Descripción

Ahora queremos aprovechar estas características a un algoritmo de sistema de recomendación. Supongamos que adoptamos un modelo de regresión lineal, hemos formado un modelo de regresión lineal para cada usuario, como θ (1) es el primer modelo de parámetros de usuario. Así, en primer lugar tenemos la siguiente fórmula (además de parámetro de regularización) Por supuesto, esta fórmula es el modelo para el primer usuario, y si esperamos que todos los usuarios del modelo, entonces tenemos la siguiente fórmula segundos. Por lo tanto, de acuerdo con la segunda ecuación estamos resolviendo las derivadas parciales de θ (n) en nuestro modelo puede actualizarse utilizando un método de descenso de gradiente.
Aquí Insertar imagen Descripción

Segundo filtrado colaborativo

El modelo anterior es que sabemos el tipo de película da valores característicos X1 y X2, si venimos de lo contrario no se conoce el valor de estos dos parámetros, pero saber que permisos valor de θ de cada usuario (i)?
Aquí Insertar imagen Descripción
También podemos utilizar nuestra función de costos para resolver el modelo de acuerdo con θ del usuario (i), un método conocido como el filtrado de colaboración que
Collaborative filtrado algoritmo utilizando los siguientes pasos:

x inicial (1), x (2 ), ... X (m), θ (1), θ (2), ... Θ (m)) para un número de valor pequeño aleatorio
utilizando un algoritmo de descenso de gradiente para minimizar la función de coste
después de la finalización del algoritmo de entrenamiento, predecimos (θ (j)) Tx ( i) para la puntuación de la película i, j usuario
Aquí Insertar imagen Descripción

En tercer lugar, la matriz de factorización de bajo rango y normalización media

1, de bajo rango matriz factorización
tenemos cinco películas, y cuatro de usuario, entonces la matriz Y es una matriz de cinco filas y cuatro columnas, los datos de usuario marcará las películas están presentes en la matriz puede ser introducido puntuación en la matriz de la derecha.
Aquí Insertar imagen Descripción
Cuando los usuarios ven una película i, y si usted está buscando un 5 con la película es muy similar a la película, con el fin de dar a los usuarios la cantidad recomendada de cinco nuevas películas, lo que necesita hacer es averiguar la película j, y en estos diferentes películas estamos buscando desde el mínimo i película, por lo que puede dar a sus usuarios recomiendan varias películas diferentes.
Aquí Insertar imagen Descripción

2, la normalización media

Media normalización (media Normalización) antes de regresar el tiempo de aprendizaje algoritmos escuela acerca de este modelo, debido a la diferencia entre el valor característico diferente es demasiado grande, a menudo es necesario ampliar valores propios, uno de los cuales es a la normalización media, fórmula es: (x - u) / ( max - min)
podemos resolver para las siguientes variables desconocidas de esta manera, los resultados de matriz Y media del proceso de normalización, cada usuario una parte de una película restando la puntuación media de todos los usuarios de la partitura de la película, para la variable desconocida, nuestro nuevo modelo pensaría que dio la puntuación de cada película es la puntuación media de la película.
Aquí Insertar imagen Descripción
Referencias "Andrew Ng máquina de aprendizaje" sistema de recomendación 16
16. El sistema de recomendación de recomendación Sistema
Andrew Ng máquina de aprendizaje notas (16) - Recomendación Sistema
Andrew Ng aprendizaje automático - Sistema de Recomendación

Publicado 80 artículos originales · ganado elogios 140 · vistas 640 000 +

Supongo que te gusta

Origin blog.csdn.net/linjpg/article/details/104401361
Recomendado
Clasificación