Serie EfficientDet (cero) -Interpretación del algoritmo EfficientDet

EfficientDet: detección de objetos escalable y eficiente

Los tres jefes de Auto ML, Mingxing Tan, Ruoming Pang y Quoc V. Le del equipo de Google Brain, publicaron un artículo EfficientDet: Detección de objetos escalable y eficiente en CVPR 2020. El código ha sido de código abierto para Github

Este trabajo puede verse como una extensión de EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks en ICML 2019 Oral, que se extiende desde tareas de clasificación hasta tareas de detección (Object Detection).

Como todos sabemos, existe una compensación entre la velocidad y la precisión de las redes neuronales, y EfficientDet es un término general, que se puede dividir en EfficientDet D1 ~ EfficientDet D7. La velocidad disminuye gradualmente, pero la precisión mejora gradualmente.

Como puede verse en la figura siguiente, el rendimiento de EfficentDet-D7 es asombroso: con 326B FLOPS y 52 M parámetros, el conjunto de datos de validación COCO 2017 ha logrado 51.0 mAP, resultados de vanguardia. En comparación con AmoebaNet + NAS-FPN, FLOPS logra mejores resultados cuando solo tiene una décima parte.
Inserte la descripción de la imagen aquí
Los principales puntos de contribución de este artículo son BiFPN y Compound Scaling, que se presentarán uno por uno a continuación.

BiFPN

Inserte la descripción de la imagen aquí
El FPN de CVPR 2017 señala la importancia de la fusión de características entre diferentes capas y utiliza un método heurístico relativamente simple para multiplicar las características subyacentes por dos veces y agregarlas a la capa poco profunda para fusionarlas. Después de eso, las personas probaron varios otros métodos de fusión, como PANet primero conectándose de abajo hacia arriba y luego volviendo a conectarse de arriba hacia abajo; M2Det agregó conexión de salto al conectarse; Libra-RCNN primero convergió todas las características a la capa media, Y luego refinar

En resumen, los anteriores son algunos diseños manuales de Lianliankan, incluidas operaciones candidatas como Conv, Sum, Concatenar, Redimensionar, Omitir y Conexión. Obviamente, se pueden buscar con NAS qué operaciones utilizar y el orden entre operaciones. Después de ingresar a la era AutoML, las cuentas NAS-FPN y el jade están por delante, y se encuentra una mejor estructura de la parte del cuello.

El autor de este artículo optimizó aún más en base a las siguientes observaciones / hipótesis:

  1. El autor observa que el efecto de PANet es mejor que el de FPN y NAS-FPN , pero la cantidad de cálculo es grande;

Referencia 1: Interpretación del algoritmo EfficientDet
Referencia 2: [Práctica del proyecto] Explicación del principio de EfficientDet y práctica del proyecto de detección de objetivos

Supongo que te gusta

Origin blog.csdn.net/qq122716072/article/details/109283197
Recomendado
Clasificación