Convolución fácil de entender

Los libros de texto generalmente definen funciones

Inserte la descripción de la imagen aquíConvolución como sigue:
una forma continua:
Inserte la descripción de la imagen aquí
forma discreta:
Inserte la descripción de la imagen aquí
y explica la primera función del tirón de g, los corresponde g-eje para el número de funciones para plegar de derecha a izquierda, que es la convolución de "volumen" Origen.

Luego cambie la función g a n, multiplique los puntos correspondientes de las dos funciones en esta posición y luego agréguelas.Este proceso es el proceso de convolución "producto".

Este artículo principalmente quiere explicar dos problemas:

  1. ¿Cómo se explica el término convolución? ¿Qué significa "rodar"? ¿Qué significa "producto"?
  2. ¿Cuál es el significado detrás de la convolución y cómo explicarla?

## Escenarios de aplicación considerados

Para comprender mejor estos problemas, primero damos dos escenarios de aplicación típicos:

  1. Análisis de la señal Después de que
    una señal de entrada f (t) pasa a través de un sistema lineal (sus características pueden describirse mediante la función de respuesta al impulso de la unidad g (t)), ¿cuál debería ser la señal de salida? De hecho, la señal de salida se puede obtener mediante operación de convolución.

  2. Procesamiento de la imagen Después de
    ingresar una imagen f (x, y) y realizar un procesamiento de convolución con un núcleo de convolución especialmente diseñado g (x, y), la imagen de salida obtendrá varios efectos, como desenfoque y mejora de bordes.

Comprensión de la convolución

Comprensión del término convolución: la llamada convolución de dos funciones es esencialmente voltear una función primero y luego realizar una superposición deslizante.

En el caso continuo, la superposición se refiere a la integración del producto de dos funciones. En el caso discreto, es la suma ponderada. Por simplicidad, colectivamente se llama superposición.

Todo se parece a este proceso:

Voltear—> Diapositiva—> Superposición—> Diapositiva—> Superposición—> Diapositiva—> Superposición ... Una serie de valores de superposición obtenidos por múltiples diapositivas constituyen una función de convolución.

La "convolución" de convolución se refiere al proceso de convertir la función de g (t) a g (-t); mientras tanto, "convolución" también significa deslizamiento. Si la convolución se traduce como "doblar", entonces la palabra "doblar" solo tiene el significado de voltear.

El "producto" de la convolución se refiere a la integración / suma ponderada.

Algunos artículos solo enfatizan la superposición deslizante y la suma, pero no dicen que la función está invertida, creo que no es exhaustiva; algunos artículos realmente entienden el "volumen" como "producto", creo que es Zhang Guanli Dai.

Comprender el significado de convolución :

  1. Del proceso de "producto", podemos ver que el valor superpuesto que obtuvimos es un concepto global. Tomando el análisis de la señal como ejemplo, el resultado de la convolución no solo está relacionado con el valor de respuesta de la señal de entrada en el momento actual, sino también con la respuesta de la señal de entrada en todo momento en el pasado, considerando la acumulación de los efectos de todas las entradas en el pasado. En el procesamiento de imágenes, el resultado del proceso de convolución es tener en cuenta los píxeles alrededor de cada píxel, incluso los píxeles de toda la imagen, y realizar un procesamiento de ponderación en el píxel actual. Por lo tanto, "producto" es un concepto global, o una especie de "mezcla", que mezcla dos funciones en el tiempo o el espacio.

  2. ¿Por qué quieres "rodar"? ¿No es bueno multiplicar directamente? Entiendo que el propósito de "rodar" (voltear) es en realidad imponer una restricción, que especifica qué usar como referencia durante el "producto". En la escena de análisis de señal, especifica el punto específico en el tiempo antes y después del "producto", en la escena de análisis espacial, especifica la ubicación alrededor de la cual realizar el proceso de acumulación.

Por ejemplo, aquí hay algunos ejemplos para explicar por qué debería invertirse y el significado de superposición y suma.

Ejemplo 2: tirar los dados
¿Cómo explicar convolución fácilmente en esta pregunta? El puesto número 1 en el compañero de clase Ma dio un buen ejemplo (algunas fotos a continuación están extraídas del artículo del compañero de clase Ma, gracias aquí), el uso de dados para ilustrar la aplicación de la convolución.

El problema a resolver es: hay dos dados, tírelos a ambos, ¿cuál es la probabilidad de que los dos dados sumen 4?

Inserte la descripción de la imagen aquí
Para analizar, hay tres casos en que los puntos de los dos dados suman 4: 1 + 3 = 4, 2 + 2 = 4, 3 + 1 = 4

Por lo tanto, la probabilidad de que los dos puntos de los dados sumen 4 es:
Inserte la descripción de la imagen aquí
La forma de escribir la convolución es:
Inserte la descripción de la imagen aquí
Aquí quiero explicar más a fondo con la lógica de voltear y deslizar la superposición anterior.

Primero, debido a que la suma de los puntos de los dos dados es 4, para satisfacer esta restricción, todavía volteamos la función g, y luego multiplicamos los números correspondientes por encima y por debajo del área de sombra, y luego sumamos, lo que es equivalente a encontrar el valor de convolución de la variable independiente 4. , Como se muestra en la siguiente figura:
Inserte la descripción de la imagen aquí
Además, después de tal cambio, se puede generalizar fácilmente para encontrar la probabilidad cuando la suma de los dos puntos de dados es n, que es la convolución f * g (n) de f y g, como se muestra en la siguiente figura :
Inserte la descripción de la imagen aquí
Como se puede ver en la figura anterior, el deslizamiento de la función g provoca un aumento en la suma de puntos. La restricción en f y g en este ejemplo es la suma de puntos, que también es la variable independiente de la función de convolución. Si está interesado, también puede calcular que si la probabilidad de cada punto del dado es igual, entonces la probabilidad de los dos dados yn = 7 es la mayor.

Ejemplo 3: procesamiento de imágenes

¿O cómo explicar la convolución de una manera simple y comprensible? Ejemplos de estudiantes chinos y malayos. La imagen se puede expresar en forma de matriz (la siguiente imagen está tomada del artículo del compañero de clase Ma)
Inserte la descripción de la imagen aquí
. La función de procesamiento de la imagen (como suavizado o extracción de bordes) también se puede representar mediante una matriz g, como:
Inserte la descripción de la imagen aquí
Tenga en cuenta que estamos tratando el problema del espacio plano, Ya es una función bidimensional, que es equivalente a:
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí
entonces, ¿cómo calcular la convolución [fórmula] de las funciones f y g en (u, v)?

De acuerdo con la definición de convolución, la forma discreta bidimensional de la fórmula de convolución debe ser: a
Inserte la descripción de la imagen aquí
partir de la definición de convolución, debe acumularse en ambas direcciones x e y (correspondientes a los dos subíndices i y j en la fórmula discreta anterior) , Y es ilimitado, desde infinito negativo hasta infinito positivo. Sin embargo, el mundo real está limitado. Por ejemplo, la función de procesamiento de imágenes g enumerada anteriormente es en realidad una matriz de 3x3, lo que significa que los valores de todos los puntos, excepto la vecindad del origen, son 0. Teniendo en cuenta este factor, la fórmula anterior en realidad se degenera, solo selecciona puntos cerca de las coordenadas (u, v) para el cálculo. Entonces, el cálculo real es el siguiente:
Inserte la descripción de la imagen aquí
Primero, sacamos la matriz en (u, v) de la matriz de imagen original:
Inserte la descripción de la imagen aquí
y luego volteamos la matriz de procesamiento de imágenes (este giro es un poco interesante, puede haber varias interpretaciones diferentes y su efecto Es equivalente: (1) primero voltear a lo largo del eje x, luego voltear a lo largo del eje y; (2) primero voltear a lo largo del eje x, luego voltear a lo largo del eje y;), de la siguiente manera:

Matriz original: Matriz
Inserte la descripción de la imagen aquí
después de voltear:
Inserte la descripción de la imagen aquí
(1) Primero voltear a lo largo del eje x, luego voltear a lo largo del eje y
Inserte la descripción de la imagen aquí
(2) Primero voltear a lo largo del eje y, luego voltear a lo largo del eje x Al
Inserte la descripción de la imagen aquí
calcular la convolución, puede usar [fórmula] y [fórmula ] producto interno:
Inserte la descripción de la imagen aquíInserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí
autor: palet
enlace: https: //www.zhihu.com/question/22298352/answer/637156871
fuente: sabemos casi
con derechos de autor por el autor. Para reproducción comercial, por favor contacte al autor para autorización, y para reproducción no comercial, por favor indique la fuente.

Tenga en cuenta que la fórmula anterior tiene la característica de que la suma de los subíndices de las dos variables correspondientes a y b para la multiplicación es (u, v), y su propósito es restringir esta suma ponderada. Es por eso que la matriz g debe voltearse. La razón por la cual los subíndices de matriz anteriores están escritos y volteados es para que todos vean la relación con la convolución más claramente. La ventaja de esto es que es fácil promover y comprender su significado físico. De hecho, en el cálculo, se usa la matriz después de voltear, y el producto interno de la matriz se calcula directamente.

El cálculo anterior es la convolución en (u, v), deslizándose a lo largo del eje x o el eje y, puede encontrar la convolución en varias posiciones en la imagen, y el resultado de salida es la imagen procesada (es decir, después del suavizado, extracción de bordes, etc.) Varias imágenes procesadas).

Piénselo más. Al calcular la convolución de la imagen, tomamos directamente la matriz en (u, v) de la matriz de la imagen original. ¿Por qué elegimos la matriz en esta posición, en esencia, para cumplir con las restricciones anteriores? Debido a que queremos calcular la convolución en (u, v), y la matriz g es una matriz 3x3, y la suma del subíndice y esta matriz 3x3 es (u, v), solo podemos tomar la imagen original con (u, v) La matriz de 3x3 en el centro es la matriz del área sombreada en la figura.

Por extensión, si la matriz g no es 3x3, sino 7x7, entonces tenemos que tomar la matriz 7x7 centrada en (u, v) en la imagen original para el cálculo. Se puede ver que este tipo de convolución es considerar todos los píxeles adyacentes en la imagen original y mezclarlos. El rango de regiones adyacentes depende de la dimensión de la matriz G. Cuanto mayor sea la dimensión, más píxeles periféricos están involucrados. El diseño de la matriz determina si la imagen de salida mixta es borrosa o más nítida que la imagen original.

Por ejemplo, la siguiente matriz de procesamiento de imágenes hará que la imagen sea más suave y parezca más borrosa, ya que realiza un procesamiento promedio con los píxeles circundantes:
Inserte la descripción de la imagen aquí
la siguiente matriz de procesamiento de imágenes hará que el cambio de valor de píxeles sea más obvio, fortalezca el borde, el cambio no afectó apacible lugar para lograr el propósito de extraer el borde:
Inserte la descripción de la imagen aquí
autor: palet
enlace: https: //www.zhihu.com/question/22298352/answer/637156871
fuente: conocer casi

19 artículos originales publicados · Me gusta2 · Visitas 740

Supongo que te gusta

Origin blog.csdn.net/zan1763921822/article/details/104512607
Recomendado
Clasificación