Tabla de contenido
1.2 Formas comunes de estandarización de datos
2 ¿Qué es la normalización por lotes?
2.3 ¿Por qué la estandarización de lotes
4 TF realiza la estandarización de lotes
4.1 Proceso de implementación:
4.2 Proceso de pronóstico estandarizado por lotes
4.3 Ubicación del procesamiento por lotes:
1 Estandarización
La estandarización en el aprendizaje automático tradicional también se denomina normalización , que generalmente consiste en asignar datos a un rango específico para eliminar problemas en el procesamiento de datos de diferentes dimensiones.
1.1 ventajas
La estandarización de datos hace que las diferentes muestras vistas por el modelo de aprendizaje automático sean más similares entre sí , lo que ayuda a modelar el aprendizaje y la generalización de nuevos datos.
1.2 Formas comunes de estandarización de datos
Estandarización y normalización : reste el promedio de los datos para hacer que su centro sea 0 y luego divida los datos por su desviación estándar para hacer que su desviación estándar sea 1 .
Para fórmulas específicas, consulte las fórmulas en el libro sobre la base del aprendizaje profundo
2 ¿Qué es la normalización por lotes (normalización por lotes)?
La normalización por lotes, similar a la normalización de datos ordinarios, es un método para unificar datos dispersos y un método para optimizar redes neuronales.
2.2 Estandarización de lotes
No solo estandariza los datos antes de ingresarlos en el modelo . Los estándares de datos deben considerarse después de cada transformación de la red.
2.3 ¿Por qué la estandarización de lotes
El problema que resuelve la estandarización por lotes es la desaparición del gradiente y la explosión del gradiente .
Beneficios de utilizar el procesamiento por lotes:
3 Resumen:
Beneficios de la estandarización por lotes
- Tiene el efecto de regularización
- Mejorar la capacidad de generalización del modelo.
- Permite una mayor tasa de aprendizaje para acelerar la convergencia
4 TF realiza la estandarización de lotes
La capa BatchNormalization se usa generalmente después de la capa convolucional o la capa densamente conectada .
4.1 Proceso de implementación:
4.2 Proceso de pronóstico estandarizado por lotes
Cuando modelamos el entrenamiento, registramos la media y la varianza en cada lote, hasta que se completa el entrenamiento, encontramos la media y la varianza de las expectativas a lo largo de los valores de la muestra de entrenamiento , nuestras predicciones como la media y la varianza BN
4.3 Ubicación del procesamiento por lotes:
El artículo original decía que generalmente debería usarse antes de la función de activación no lineal en CNN, pero de hecho, el efecto puede ser mejor después de la función de activación.
4.4 Código de implementación: