Los clasificadores Naive Bayes generalmente funcionan mejor que otros clasificadores más complejos, como el algoritmo de máquinas de vectores de soporte (SVM) para la clasificación Naive Bayes

Autor: Zen y el arte de la programación informática

1. Introducción

¿Qué es la clasificación bayesiana ingenua?

El clasificador "Naive Bayes" es un método de clasificación probabilística simple y efectivo basado en el teorema de Bayes. El clasificador cree que para un documento (o texto) dado, cada palabra o frase es condicionalmente independiente, y su probabilidad de ocurrencia depende únicamente de la posibilidad de que la palabra o frase aparezca sola. Los clasificadores bayesianos ingenuos pueden clasificar documentos con precisión teniendo en cuenta la independencia de cada característica. Tiene las características de alta eficiencia, precisión y estabilidad. En la práctica, los clasificadores naive bayesianos suelen funcionar mejor que otros clasificadores más complejos, como las máquinas de vectores de soporte (SVM).
Actualmente, muchos conjuntos de datos se pueden clasificar utilizando el algoritmo Naive Bayes. Estos incluyen filtrado de spam, clasificación de texto, reconocimiento de imágenes, modelos de lenguaje, biomarcadores y previsión de existencias.

¿Por qué elegir el algoritmo de clasificación bayesiano ingenuo?

1. Fácil de entender e implementar

El algoritmo de clasificación Naive Bayesian es muy fácil de entender y fácil de implementar. Su proceso de cálculo es más intuitivo y la velocidad de cálculo es rápida. No se preocupe por complicar demasiado las derivaciones de fórmulas.

2. Pequeña sobrecarga computacional

El algoritmo de clasificación bayesiano ingenuo no requiere un proceso de entrenamiento complicado y solo necesita muy pocos datos para obtener buenos resultados de clasificación. Por lo tanto, incluso el procesamiento de cantidades masivas de datos no ejercerá demasiada presión sobre los recursos informáticos.

3. Aplicable a varios campos.

El algoritmo bayesiano ingenuo puede manejar varios tipos de datos de características, como datos de texto, datos de imágenes, señales de voz, etc. También se puede utilizar para problemas de clasificación de clases múltiples, al mismo tiempo que se adapta a distribuciones de muestras desequilibradas.

4. No se ve afectado por el tamaño de la muestra

Dado que el algoritmo Naive Bayesian es un algoritmo de aprendizaje no supervisado, no se requiere un etiquetado adicional de los datos. El resultado de la clasificación depende solo de la distribución de los datos de entrada y el ingenuo

Supongo que te gusta

Origin blog.csdn.net/universsky2015/article/details/132126838
Recomendado
Clasificación