Aprendizaje automático: detección de anomalías

inserte la descripción de la imagen aquí

definición del problema

inserte la descripción de la imagen aquí
anomalía, valor atípico, novedad, excepciones

Diferentes enfoques utilizan diferentes términos para definir este tipo de problema.

inserte la descripción de la imagen aquí

solicitud

inserte la descripción de la imagen aquí

Dos categorías

inserte la descripción de la imagen aquí

Si solo hay datos normales y el rango de datos anormales es muy amplio (no exhaustivo), la clasificación binaria no es fácil de hacer. Además, los datos anormales no son fáciles de recopilar.

Clasificación

inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
Cada imagen está etiquetada y puedes entrenar a un clasificador de miembros de la familia Simpson.
inserte la descripción de la imagen aquí
Detección de anomalías basada en clasificador.
inserte la descripción de la imagen aquí
Haga preguntas anormales basadas en puntajes de confianza. Si es mayor que cierto valor, es normal, y si es menor que cierto valor, es anormal. El puntaje máximo se juzgará erróneamente como parte de los datos de confianza
inserte la descripción de la imagen aquí
.
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí

Estimación del puntaje de confianza

inserte la descripción de la imagen aquí
Enseñe directamente el puntaje de confianza de la red, no solo haga la tarea de clasificación C, sino que también proporcione el puntaje de confianza P

Entrenar y Evaluar

inserte la descripción de la imagen aquí
100 fotos de los Simpson, 5 fotos anómalas
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí

  • Los gráficos normales con color azul se clasifican erróneamente como anormales
  • Los mapas anormales con color rojo se clasifican erróneamente como normales

En este momento, utilice el conjunto de desarrollo para evaluar el sistema, que es un problema de clasificación binaria.
inserte la descripción de la imagen aquí
La distribución de proporciones normales y anormales es muy diferente. Este sistema puede tener una alta tasa de precisión, pero no hace nada. No tiene sentido usar la tasa de precisión ACC para clasificar.

inserte la descripción de la imagen aquí
Use la matriz de confusión:
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
tabla de costos, el costo de hacer un mal comportamiento, calcule una puntuación:
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
configure la tabla de costos para sus propias tareas. También existen algunos métodos para medir, como el AUC (área de la curva ROC).

pregunta

inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
Si la cara es amarilla, entonces el sistema dará una puntuación alta, lo que significa que lo que aprende el sistema de clasificación no es reconocer a las personas, sino si la cara es amarilla.

inserte la descripción de la imagen aquí
Suponga que puede recibir algunos datos anormales, puede aprender a clasificar y dar puntajes anormales al mismo tiempo, pero este tipo de datos no es fácil de recopilar. Considere usar GAN para generar datos anómalos.

Escenas sin etiquetas

inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
Jugadores normales y jugadores anormales (Xiaobai)

definición del problema

inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
Se necesita un método numérico para dar a cada jugador una puntuación. f (personal) f (personal)f ( sta ) estimación de la densidad de probabilidad
inserte la descripción de la imagen aquí
Distribución gaussiana
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/uncle_ll/article/details/132007146
Recomendado
Clasificación