Estrategias comunes de CV:
Hold-out; Kfold, GroupKFold, StratifiedKFold, TimeSeriesSplit
Concepto de validación adversaria (verificación de confrontación) : es un método de detección de características comúnmente utilizado, que se utiliza para encontrar las características de fluctuaciones de tiempo obvias.
Operación
- Codificación binaria del conjunto de entrenamiento dividido y el conjunto de verificación (conjunto de prueba), por ejemplo, agregue un ad_target = 1 para el conjunto de entrenamiento y agregue un ad_target = 0 para el conjunto de verificación
- Entrene un modelo de clasificación binaria simple, el objetivo es hacer una clasificación binaria en ad_target
- Solo se usa una función para cada entrenamiento, y el AUC del conjunto de validación se registra cuando el modelo converge
- Itere el paso 3 hasta que se atraviesen todas las características, y las características se ordenen de mayor a menor según el índice AUC
- Concéntrese en el análisis de AUC más alto, el umbral de experiencia se puede seleccionar 0.7, 0.8; preste atención al problema de los valores perdidos
Verificación adversaria (resolución de perturbaciones CV); observación de características con distribución