Los problemas encontrados durante el análisis de la escena.
Módulo de agrupación piramidal
El rojo indica la capa de agrupación global más gruesa.
El número de capas piramidales y el tamaño de cada capa se pueden modificar. El módulo de grupo piramidal en este documento es un módulo de cuatro capas cuyos tamaños son 1 × 1, 2 × 2, 3 × 3 y 6 × 6, respectivamente.
(B) Obtenida por la red de reventa pre-entrenada con convolución de agujeros, su tamaño es 1/8 del tamaño de entrada
Supervisión profunda para FCN basado en ResNet
La imagen de arriba muestra un ejemplo de nuestro modelo ResNet101 supervisado en profundidad. Además de usar la pérdida softmax (pérdida de rama principal) para entrenar al clasificador final, se usa otro clasificador después de la cuarta etapa, a saber, el módulo residual res4b22. La pérdida auxiliar ayuda a optimizar el proceso de aprendizaje, mientras que la pérdida de la rama principal tiene la mayor responsabilidad. Aumentamos el peso para equilibrar las pérdidas auxiliares. En la fase de prueba, abandonamos la rama auxiliar y utilizamos solo la rama principal optimizada para la predicción final.