Red de análisis de escenas piramidales (PSPNet)

código

Los problemas encontrados durante el análisis de la escena.

Inserte la descripción de la imagen aquí

Módulo de agrupación piramidal

Inserte la descripción de la imagen aquí
El rojo indica la capa de agrupación global más gruesa.
El número de capas piramidales y el tamaño de cada capa se pueden modificar. El módulo de grupo piramidal en este documento es un módulo de cuatro capas cuyos tamaños son 1 × 1, 2 × 2, 3 × 3 y 6 × 6, respectivamente.
(B) Obtenida por la red de reventa pre-entrenada con convolución de agujeros, su tamaño es 1/8 del tamaño de entrada

Supervisión profunda para FCN basado en ResNet

Inserte la descripción de la imagen aquí
La imagen de arriba muestra un ejemplo de nuestro modelo ResNet101 supervisado en profundidad. Además de usar la pérdida softmax (pérdida de rama principal) para entrenar al clasificador final, se usa otro clasificador después de la cuarta etapa, a saber, el módulo residual res4b22. La pérdida auxiliar ayuda a optimizar el proceso de aprendizaje, mientras que la pérdida de la rama principal tiene la mayor responsabilidad. Aumentamos el peso para equilibrar las pérdidas auxiliares. En la fase de prueba, abandonamos la rama auxiliar y utilizamos solo la rama principal optimizada para la predicción final.

Publicado 12 artículos originales · elogiado 4 · visitas 1266

Supongo que te gusta

Origin blog.csdn.net/qq_36321330/article/details/105329024
Recomendado
Clasificación