Análisis de clasificación de datos - Combinación de clasificadores



1. Introducción

El origen de la serie de algoritmos de aprendizaje integrado proviene de la capacidad PAC Learn (se puede aprender la aproximación de probabilidad), y la teoría PAC define la fuerza del algoritmo de aprendizaje.

El clasificador combinado es un modelo compuesto que consta de múltiples clasificadores base.Después de que se proporciona un conjunto de entrenamiento, el conjunto multiclase puede entrenar múltiples clasificadores base diferentes. En la etapa de clasificación, cada clasificador base participa en la clasificación de casos de prueba y da resultados, y luego combina los resultados de clasificación proporcionados por diferentes clasificadores base según un método determinado para obtener el resultado de clasificación final.

2. Clasificador combinado de ensacado de 1 bolsa

Combine K modelos aprendidos M1, M2, ..., Mk para formar un modelo de clasificación compuesto M* y luego divida el conjunto de datos D en k partes, D1, D2, ..., Dk, para entrenar el modelo de clasificación base M1 , M2, ..., Mk. Al predecir un conjunto de prueba, cada clasificador base vota de acuerdo con su propio resultado de predicción, y el clasificador de combinación genera el resultado de predicción con el voto más alto como resultado final.


3. Clasificador combinado 2-mejorando AdaBoost

El embolsado es simplemente una combinación de clasificadores básicos.
AdaBoost es un proceso iterativo que hace que el clasificador base preste más atención a aquellas muestras que se clasificaron incorrectamente en la ronda anterior.
El proceso básico es el siguiente:
(1) Al principio, asigne un peso igual 1/d a cada muestra en el conjunto de datos de entrenamiento
(2) Muestreo con reemplazo de D según el peso, después de obtener k conjuntos de entrenamiento, y luego obtener k clasificador base.
(3) Después de generar el clasificador, prediga el conjunto de datos D, ajuste el peso de la muestra de acuerdo con el resultado de la predicción, aumente el peso de la muestra clasificada incorrectamente y disminuya el peso de la muestra clasificada correctamente.
(4) Al mismo tiempo, se asignan pesos a cada clasificador base, cuanto menor sea la tasa de error del clasificador base, mayor será la tasa de precisión y mayor el peso de Votación.

Supongo que te gusta

Origin blog.csdn.net/weixin_47250738/article/details/125461104
Recomendado
Clasificación