artículos de fondo blanco - Historial de detecciones (vi) la elaboración de detección de objetivos YOLO-V3

Saltar al contenido principal

Devuelve el directorio de la historia de la detección de objetos

Anterior: artículos de fondo blanco - Historial de detecciones (cinco)  elaborada SSD detección de blancos

: Siguiente artículos de fondo - historia detección de blancos (siete)  elaborar YOLO-V3 de detección de código objeto de la detallada

 

Papel Dirección: "YOLO-V3"

Dirección Código: tf_yolov3_pro

 

En esta sección, elaborar la detección de blancos YOLO-V3, la detección de blancos en la siguiente sección de códigos elaborados detallada YOLO-V3

 

Siete. Detección de objetivos YOLO-V3

YOLO (sólo se verá una vez, YOLO) una vez que se mira

YOLO-V1: 2015 Nian, YOLO-V2 / 9000: 2017 Nian, YOLO-V3: 2018 Nian

1. representar a su mirada YOLO nuevo. Es un detector de blanco detectar una profundidad objetivo de un convolucional red neuronal característica de aprendizaje del uso. YOLO sólo la capa convolucional, por lo que es una red completa de convolución (FCN). En la siguiente toma de muestras, la capa de la puesta en común no se utiliza, pero el uso de un paso de 2 mapas de características convolucionales intercalación realizada en la operación de muestreo. Esto ayuda a evitar que se acumule perdido las características subyacentes.

 

2. YOLO-V3 tres función mapea el uso de diferentes tamaños de escala para la predicción. Cada ubicación (pixel) en cada dimensión de la función de mapas y cuadros delimitadores se utilizan tres relaciones de aspecto diferentes predichos. Entonces, el muestreo correspondiente a la función escala 3 escalas de tamaño diferentes x2 Feature mapas lleva respectivamente a cabo por la longitud final de la función de los mapas de columna vertebral, amplio mapas obtenidos por concat. Los anclajes y la distribución pueden ser determinados por la posición de cuadros delimitadores de k-medias de agrupación. datos COCO establecidos en tres diferentes escalas de cuadros delimitadores anclajes divididos en nueve grupos correspondientes, que son: (10 x 13), (16 x 30), (33 x 23), (30 x 61), (62 x 45), (59 x 119), (116 x 90), (156 x 198), (373 x 326)

 

3. pasos YOLO-V3 de:

  (1) Toda la imagen es de entrada, la extracción de tres mapas de características de diferentes escalas mediante la preparación de CNN (dividido en grande, mediano y pequeño escala 3) para la siguiente predicción. 

  (2) La dimensión mínima de la función de mapas divididos en dos partes, una parte para predecir, por 1 parte upsampled, para dar (1) obtenido después de la anterior característica upsampled mapas de características de mesoescala mapas para el concat, la característica concat mapas obtenidos después subdividida en 2 partes, una parte para predecir, para una característica parte mapas upsampled, obtenido después de más característica upsampled mapas obtenidos en (1) fueron concat gran escala, el concat resultante la función mapas de predecir.

  (3) La función de mapas en tres dimensiones iou_loss (o giou_loss), conf_loss, se añadieron prob_loss y, a continuación, añadir tres pérdida puede obtener la pérdida total (ya que, a veces tenemos que mirar a la pérdida total es cuánto).

 

diagrama de flujo 4. YOLO-V3

   estructura de la red darknet

      Modelo de referencia y el rendimiento

 

Las escalas de pronóstico

    En Yolo-V3, la predicción se realiza mediante tres escalas diferentes, se detecta la capa de detección como teniendo un paso ancho 32,16,8 estos tres característica mapas de diferentes escalas. Este medio, serán examinados bajo 13 x 13,26 x 26,52 x 52 dimensiones en el caso de la entrada de 416 x 416. disminución de la resolución de la red la imagen de entrada, hasta que la primera característica mapas utilizados en los pasos medida en que la capa de detección 32 para la detección. Además, la capa superior fue muestreado dos veces, y concat con mapas de características anteriores tienen las mismas dimensiones; ahora, se detecta el uso de un paso a la otra capa 16, el mismo procedimiento se repite operación de muestreo, el paso final es utilizar web es una capa de 8 a detectar.

 

6. explicar salida

    Típicamente, el (la detección de blancos para todos) capa convolución aprende todas las características se transmitirán a la clasificación o la regresión, y se detecta a continuación, la clasificación a continuación o predicción de regresión (que limita coordenadas cajas, categoría, etc.) . En Yolo-V3, la capa 1 se obtiene mediante la convolución de X 1 a la deformidad predicho. Cada 1 x 1 puede predecir el tamaño de la célula de un número fijo de la caja delimitadora. En profundidad, hay artículos (B x (5 + c)) en los mapas de características.

       El número de cajas de contorno para cada celda se puede predecir: B

       5 + c: cuadro delimitador para cada propiedad en propiedad, dos cada una para describir las coordenadas del centro del cuadro delimitador, la dimensión, la puntuación objetiva (primer o segundo plano) y la confianza de la clase C (probabilidad). Cada celda de la predicción YOLO-V3 tiene tres cuadros delimitadores.

  (1). Las castañas

       Li imagen de entrada 416 x 416, un paso 32 como, característica mapas de la salida de 13 x 13

 

  (2) Si el rango del punto central del objeto cae campos receptivos de células, es deseable en función de hambre mapas de cada célula para un cuadro de destino predicho a través del cual un delimitador. Este método de formación YOLO-V3 Y sobre esto es un cuadro delimitador se encarga de detectar cualquier objeto dado. En primer lugar, debe determinar qué células son de este cuadro delimitador; a continuación, seleccione la celda comprende una caja de objetos realidad del terreno como el punto central de la célula responsable de un objeto de predicción (mapeado de la imagen de entrada para los mapas de características predicción) el punto central.

  (3) Las coordenadas centrales

      YOLO-V3 aquí predecirse mediante la ejecución de un centro de coordinar la función sigmoide. Por lo general, YOLO-V3 no predicen las coordenadas absolutas del punto central de los cuadros delimitadores, pero el predicho desviado de las coordenadas del punto central:

    ①. Coordinar valor de la celda superior izquierda de la de destino de predicción primera red

    ②. A continuación, los mapas de características se normalizan con el tamaño de la celda de entre 0 y 1 (tratado con una función sigmoide obtenido) predijo desplazamiento

    ③. En este caso, las coordenadas absolutas del cuadro delimitador de ①, ② la adición.

    ④. Las castañas

        Li por ejemplo, la función de predicción se asigna a un 13 x 13 anterior es Li, si el valor predictivo del punto central (0.4, 0.7), que significa que el punto de centro en (6.4, 6.7) anterior (para la línea de cuadrícula de color rojo 7 columna de entramado 7, las coordenadas de la esquina superior izquierda es (6, 6)).

        Sin embargo, si la función de predicción asigna el tamaño de la célula no está estandarizada entre 0 y 1, la predicción (x, y) las coordenadas, no puede ser mayor que 1. Por ejemplo (1.2, 0.7), lo que significa que el punto central ( 7.2, 6.7). Celda a la derecha en este momento el punto central donde los glóbulos rojos, o que está en 7 8 la columna de la línea celular. Esto viola la teoría detrás de Yolo, porque si los glóbulos rojos encargados de destino de predicción, el objetivo central debe estar en el glóbulo rojo, en lugar de la celda contigua a la celda roja en.

        Por lo tanto, para resolver este problema mediante la salida de una función sigmoide de las cuales se comprimió en entre 0 y 1, con lo que sostiene eficazmente el punto central predicho en la cuadrícula.

        

  (4) La predicción del tamaño de los cuadros delimitadores

        Por salida de la aplicación de conversión de espacio logarítmico y, a continuación, multiplicado por el tamaño de la función de predicción de los mapas del tamaño previsto de las dimensiones de las cajas y cajas, finalmente, que limitan se puede asignar de nuevo a la de la imagen de entrada para conseguir objetivos reales. Por ejemplo, los mapas de 13 x 13 función de predicción, la predicción  \ Grande t_ {w}, \ Grande T_ {h} los resultados de la anchura de la imagen y la altura de la normalizado (el proceso de entrenamiento es una tal etiqueta). Así, si el valor predictivo de los cuadros delimitadores de que contiene la diana  \ Grande t_ {w} y  \ Grande T_ {h} es (0.3, 0.8), entonces el ancho real y la altura en la función de predicción mapas 13 x 13 es A (13 x 0,3, 13 x 0,8 ).

  (5) puntuación objetiva (en primer plano y el fondo de juicio)

       La probabilidad de rendimiento de puntuación objetivo del objeto contenido dentro de los cuadros delimitadores, la probabilidad de la rejilla alrededor del rojo y debe estar cerca de 1, mientras que la probabilidad de una esquina de la rejilla debe estar cerca de cero. Sigmoide puntuación de la función objetivo es conseguir a través, porque se entiende como una probabilidad.

  (6) obtener predicciones finales

       Para el tamaño de la imagen es de 416 x 416, YOLO-V3 se predice cuadros delimitadores:

           (52 x 52 + 26 x 26 + 13 x 13) x 3 = 10 647 º

       Sin embargo, en la imagen, solamente un objeto de destino, que quieren una diana de detección es generalmente de 10.647 a 1. Use los pasos siguientes para lograr:

    ①. Umbral de probabilidad de objetos de

         caja blindado según la probabilidad de que el objeto. Por lo general, se ignorará el cuadro de puntuación por debajo del umbral.

    ②. Non-maxima NMS (Supresión no máxima, NMS) inhibición

       NMS está diseñado para resolver el problema de la detección múltiple de la misma imagen. supresión no máximos, por definición, no es a los elementos a suprimir de gran valor, se puede entender como la más grande de búsqueda local. proceso de NMS:

      a. Obtener la lista de delimitación caja, y clasificación de puntuación de confianza (probabilidades de clase c) de acuerdo.

      b. Seleccione el cuadro delimitador de confianza más alto agregado a la salida final de la lista, y quitarlo de la lista del cuadro de límite.

      c. calcular el área de la caja de contorno de todos

      D. IOU calcula altos cuadros de la confianza de delimitación de otros cuadros delimitadores.

      e. Retire el grado de reconocimiento de deuda mayor que el umbral de solapamiento cuadros delimitadores

      f. Repita el procedimiento anterior hasta que la lista es cuadros delimitadores vacíos.

 

    La eficiencia y la precisión

 

                  

 

Saltar al contenido principal

Devuelve el directorio de la historia de la detección de objetos

Anterior: artículos de fondo blanco - Historial de detecciones (cinco)  elaborada SSD detección de blancos

: Siguiente artículos de fondo - historia detección de blancos (siete)  elaborar YOLO-V3 de detección de código objeto de la detallada

Publicado 63 artículos originales · alabanza ganado 16 · vistas 5981

Supongo que te gusta

Origin blog.csdn.net/qq_38299170/article/details/104470656
Recomendado
Clasificación