directorio
1. Categorías de datos - retroalimentación explícita e implícita de realimentación
2. Evaluación del modelo de datos de retroalimentación explícita
3. Introducción de datos de realimentación implícita
1. Categorías de datos - retroalimentación explícita e implícita de realimentación
Los datos utilizados en la clase de entrenamiento / recomendación cuando el modelo se puede dividir en dos tipos, tanto los datos de retroalimentación explícita e implícita.
retroalimentación explícita de datos: El usuario le gusta y lo que no expresa elementos (o tipos de datos explícitos)
retroalimentación de datos invisibles: los usuarios navegar a través de los artículos, pero no estaba claro gusto o disgusto. Este tipo de datos sólo puede pensar en retroalimentación positiva que es todos los elementos favoritos.
Para el castaño:
Usuarios en iQIYI a una puntuación de 10 puntos película, está claro que el usuario es una película favorita.
Este usuario Tiempo de visualización de 10 películas, pero no anotó, nosotros no lo sabemos, al final nos guste o no, pero se puede utilizar como un dato de referencia.
explícita de datos nos da una gran comodidad, pero en muchos casos no hay datos explícitos o desaparecidos. Los datos de retroalimentación invisible es fácilmente disponible, por lo que la introducción de estos dos método de evaluación de datos para entrenar el modelo.
2. Evaluación del modelo de datos de retroalimentación explícita
Modelo de la determinación Recomendado |
El modelo está determinada a no ser recomendado |
|
---|---|---|
equipo de prueba debe ser recomendado |
verdaderos positivos (clase TP positivo se determina positiva basada) |
falsos positivos (FP se determina la clase positivo negativo basado) |
equipo de prueba no es lo recomendado | falsos negativos (clase FN positivo es negativo basado determinar) | verdaderos negativos (determinación de tipo negativo TN es de clase negativa) |
Se puede calcular de acuerdo con la precisión y la recuperación de TP, FP, FN, TN. Y luego para calcular la precisión y la recuperación de otros métodos de evaluación.
tasa de precisión (precisión) de la fórmula es
Recall (recuerdo) fórmula es
Los dos datos restringen mutuamente, por lo que el uso de F-medida es por lo general una combinación de ambos, se calcula.
Al tomar β 1, que es el más común F1-Medida
3. Introducción de datos de realimentación implícita
datos de retroalimentación implícitas tienen muchos defectos, como poco claro, con los datos de ruido, pero debido a su extendido, a veces sólo pueden utilizarlo, por lo que debemos mirar en detalle.
datos de retroalimentación explícita se puede ver en el valor de preferencia del usuario de un elemento, como mecanismo de puntuación, 8 puntos y 10 puntos de diferencia, y no hay manera de medir la retroalimentación implícita valor de preferencia de datos, sólo se puede pensar que cuantos más usuarios vean el mismo contenido, más puede recibir el contenido, es decir, cuanto mayor es el grado de confianza.