Agrupación de Roi y RoiAlign

Agrupación de RoI, alineación de RoI

Nota: RoI está en la imagen original.

Referencia: https://blog.csdn.net/qq_29598161/article/details/108137399

Agrupación de RoI:

  1. El cuadro candidato de la imagen original se asigna al mapa de características . Por ejemplo, 665 * 665 se asigna al mapa de características 25 * 25 como 665/32 (relación de escala) = 20,78, que se redondea a 20. Las coordenadas de la parte superior El vértice de la esquina izquierda también se asignará una vez y las coordenadas también se asignarán. El redondeo no caerá en el contenedor. Esta es la primera cuantificación.
  2. Si la salida de la agrupación es 7 * 7, entonces la característica asignada anteriormente se dividirá en 49 contenedores del mismo tamaño (la longitud y el ancho de la característica son diferentes y el contenedor es un rectángulo, como se muestra en el gif a continuación), y el tamaño de cada contenedor es 20/7 = 2,86, que es 2 después del redondeo, que es la segunda cuantificación
  3. Tome el máximo en cada contenedor, maximice la agrupación y obtenga un mapa de características de tamaño 7*7

Propagación hacia atrás en la agrupación de RoI

Propagación hacia atrás en la capa ROI, haga los siguientes juicios en la cuadrícula de cada propuesta, xi x_iXyo¿Corresponde i al ROI actual? En otras palabras, i = i ∗ ( r , j ) i = i ∗ ( r , j )i=i( r ,j ) representa el ii-ésimoen el mapa de característicasSi el nodo i está en el área candidata rrr'sjj __Los j nodos se seleccionan como el valor máximo de salida. Si es así, suma las siguientes propuestas, obteniendo así $ \frac{\partial L}{\partial x_{i}} $

GIF

Alineación de retorno de la inversión (2018):

Dado que las dos cuantificaciones (operaciones de redondeo) del proceso de agrupación de roi anterior provocarán una desalineación, para realizar una segmentación semántica fina, roialign implementa la alineación de píxel a píxel sin operaciones de redondeo.

[La transferencia de la imagen del enlace externo falló. El sitio de origen puede tener un mecanismo anti-leeching. Se recomienda guardar la imagen y cargarla directamente (img-Qh75DGe4-1685506927848) (C:\Users\86188\Pictures\works\roialign .png)]

La salida de alineación en la imagen siguiente es 2*2, que es diferente del 7*7 que expliqué:

Insertar descripción de la imagen aquí

  1. El RoI de la imagen original se asigna al mapa de características sin redondear (la salida de alineación en la Figura 3 es 2 * 2), se supone que todavía es 665/32 = 20,78 y se conserva el número de punto flotante.
  2. Divida directamente el mapa de características mapeadas en un mapa de características de tamaño 7 * 7 (alinee el tamaño de salida) y divídalo en varias áreas del mismo tamaño.
  3. El número de puntos de muestreo en el artículo es 4, lo que significa que cada contenedor se divide en cuatro partes iguales y se toma la posición del punto central (cruz roja). El píxel del punto central se calcula mediante el método de interpolación bilineal (el punto central y los cuatro vértices del cuadrado característico donde se encuentra, el vértice de la esquina superior izquierda es el punto correspondiente al valor del cuadrado), un contenedor obtiene cuatro valores (esquina superior izquierda)
  4. Cada contenedor toma max como valor para obtener el resultado final.

Será más preciso utilizar RoIAlign para imágenes con muchos objetos pequeños .

El resultado final del muestreo no es sensible a la ubicación de los puntos de muestreo ni al número de puntos de muestreo.

interpolación lineal simple

Dados los datos (x0, y0) y (x1, y1), necesitamos calcular el valor y de una determinada posición x en la línea recta en el intervalo [x0, x1] .

Escribe aquí la descripción de la imagen.

Escribe aquí la descripción de la imagen.

interpolación bilineal

Hay dos direcciones y valores correspondientes.

Realice una única interpolación lineal en ambas direcciones.

Escribe aquí la descripción de la imagen.

Queremos obtener el valor de la función desconocida f en el punto P = (x, y)

Se conocen los valores de la función f en los cuatro puntos Q11 = (x1, y1), Q12 = (x1, y2), Q21 = (x2, y1) y Q22 = (x2, y2)

Primero realice una interpolación lineal en la dirección x.

Escribe aquí la descripción de la imagen.

Luego realice una interpolación lineal en la dirección y.

Escribe aquí la descripción de la imagen.

Comparado:

agrupación

Insertar descripción de la imagen aquí

alinear

Insertar descripción de la imagen aquí

M6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mjc4MjE1MA==,talla_16,color_FFFFFF,t_70)

Supongo que te gusta

Origin blog.csdn.net/qq_52038588/article/details/130966393
Recomendado
Clasificación