Notas de procesamiento de imágenes (OpenCV)

Prefacio

Cuando escribí el quinto capítulo de la estructura de datos antes , cuando hablaba de matrices, quería escribir una nota sobre el procesamiento de imágenes, porque el contenido del quinto capítulo de la estructura de datos es la compresión de matrices bidimensional, que está relacionada con el procesamiento de imágenes.

Dio la casualidad de que todavía podía encontrar las notas de procesamiento de imágenes en mi tercer año, así que migré las notas que escribí en Word al blog. Complementa la sección de conocimientos de mi blog.

Al escribir notas de blog durante este período, descubrí que los mapas mentales y los blogs tienen sus propios méritos y deben combinarse. Los mapas mentales simples son incómodos de entender y los documentos simples son incómodos para tener una comprensión general.

En el futuro, si la eficiencia lo permite, use mapas mentales para presentar la estructura del pensamiento, use imágenes para mostrar puntos de vista clave, use tablas para comparar y use artículos para contar el contenido.

Si la eficiencia no está permitida, entonces sigue siendo puro mapa mental y texto Después de todo, la composición tipográfica y el presagio requieren demasiada energía.

Directorio de artículos

Notas de procesamiento de imágenes (OpenCV)

notas

Capítulo uno Introducción

Inserte la descripción de la imagen aquí

1. Aplicaciones de procesamiento de imágenes : reconocimiento facial, reconocimiento de matrículas, reconocimiento de peatones, reconocimiento de gestos, reconocimiento de huellas dactilares, reconocimiento de iris, reconocimiento de movimiento.

2. El campo del procesamiento de imágenes : vida diaria, industria del entretenimiento cinematográfico y televisivo, campo militar, imágenes infrarrojas, imágenes médicas, visión por computadora

Capítulo 2 Digitalización de imágenes

\ 1. Digitalización de imágenes : se refiere a la representación digital de la imagen después de que la imagen analógica se discretiza, incluida la discretización espacial (es decir, muestreo) y la discretización de los datos de representación claros y oscuros (es decir, cuantificación).

\ 2. Muestreo : se refiere a la operación de convertir una imagen espacialmente continua en un conjunto discreto de puntos de muestreo (es decir, píxeles). Dado que la imagen es información distribuida en dos dimensiones, el muestreo se realiza tanto en el eje x como en el eje y. En general, el intervalo de muestreo en la dirección del eje xy en la dirección del eje y es el mismo.

\ 3. Resolución : se refiere al tamaño del elemento de la escena asignado a un solo píxel en el plano de la imagen.

Unidad: píxel / pulgada, píxel / cm (por ejemplo: índice de escáner 300 ppp)

Unidad: Píxeles (por ejemplo: índice de cámara digital 300.000 píxeles (640 480))

\ 4. Intervalo de muestreo : si el intervalo de muestreo es demasiado pequeño, la cantidad de datos se incrementará; si es demasiado grande, la información tendrá un alias, lo que dará como resultado detalles irreconocibles (como un mosaico).

\ 5. Cuantización : Después de discretizar la información clara y oscura contenida en cada píxel, se representa mediante números. El valor de cuantificación general es un número entero. Después de considerar completamente la capacidad de reconocimiento del ojo humano, las imágenes actuales para fines no especiales son todas de cuantificación de 8 bits, es decir, se usa un número entero de 0 a 255 para describir "de negro a blanco". Cuantización por debajo de 3 bits, aparecerá un fenómeno de contorno falso; dibujo de póster; la escala de grises de 2 niveles es binarización

6. Descripción de imagen digital : se refiere a cómo representar una imagen de forma numérica. Una imagen digital es una representación digital de una imagen y el píxel es su unidad más pequeña. Dado que la matriz es bidimensional, se puede utilizar para describir imágenes digitales. La matriz que describe la imagen digital utiliza actualmente una matriz de números enteros, es decir, el brillo de cada píxel, que está representado por un número entero.

7. Una imagen en escala de grises es una información de imagen de cada píxel mediante un nivel de gris cuantificado que se describe, sin información de color.

8. Una imagen en color se refiere a una imagen en la que la información de cada píxel está compuesta por los tres colores primarios de RGB, donde RGB se describe mediante diferentes niveles de gris. Las imágenes en color no se pueden describir mediante una matriz. Generalmente, se utilizan tres matrices para describir al mismo tiempo.

imagen-20201027104431355

imagen-20201027104441842

9. ** La estructura general del archivo de mapa de bits: ** Encabezado de archivo, encabezado de información, modo de color verdadero (valor RGB del píxel), modo de color de índice (paleta + valor de índice de color); la inversión de gris es el efecto negativo

Capítulo tres Procesamiento de imágenes binarias

1. El problema del procesamiento de imágenes binarias : hay objetivos falsos en el objetivo extraído, varios objetivos tienen adherencias o roturas, varios objetivos tienen diferentes formas.

2. Conexión : hay cuatro conexiones y ocho conexiones (el píxel actual es negro y al menos uno de sus ocho píxeles vecinos es negro);

3. Dominio conectado : la colección de píxeles negros conectados entre sí se denomina dominio conectado.

4. Métodos de análisis de imágenes binarias : etiquetado, corrosión, expansión, operación de apertura, operación de cierre, método de adelgazamiento

5. Etiquetado:

6. Corrosión : Es un proceso de eliminar los puntos límite del dominio conectado y reducir el límite hacia adentro. El tratamiento contra la corrosión puede separar diferentes objetos que están pegados entre sí y puede eliminar el ruido de las partículas pequeñas.

7. Expansión : es el proceso de fusionar los puntos de fondo del área objetivo en el objetivo y expandir el límite del objetivo hacia el exterior.

8. Propuesta de operación abierta y operación cerrada: Las operaciones de expansión y corrosión introducidas en segundo plano tienen muy buen efecto en el posprocesamiento del blanco. Sin embargo, una desventaja de los cálculos de corrosión y expansión es que cambian el tamaño del objetivo original. Para resolver este problema, considerando que la corrosión y la expansión son un par de cálculos inversos, los cálculos de expansión y corrosión se realizan simultáneamente. Esto constituye una operación abierta y una operación cerrada.

9. Operación abierta : el procesamiento de corrosión se realiza primero en la imagen original y luego se realiza el procesamiento de expansión. La operación abierta básicamente puede mantener el tamaño del objetivo original mientras separa el objetivo adherido.

10. Operación de cierre : consiste en expandir primero la imagen original y luego corroerla. La operación cerrada básicamente puede mantener el tamaño del objetivo original mientras se fusiona el objetivo roto.

\ 11. Proceso de adelgazamiento : El proceso de encontrar el esqueleto de una imagen. Después del proceso de adelgazamiento, la amplitud de todas las líneas en la imagen es un píxel.

Capítulo 4 Procesamiento de imágenes en color

Analizaremos métodos como corrección de nivel de color, suavizado y filtrado de imágenes, procesamiento de nitidez de imagen, etc., así como métodos como compensación de color y balance de color.

Capítulo 5 Supresión de ruido en la imagen

1. El llamado ruido de imagen es la señal de interferencia aleatoria que se recibe cuando se toma o se transmite la imagen. Los más comunes son el ruido de sal y pimienta y el ruido de Gauss .

2. Las características del ruido de sal y pimienta: la posición de apariencia es aleatoria , pero la amplitud del ruido es básicamente la misma .

Las características del ruido gaussiano: aparece en una determinada posición (en cada punto ), pero la amplitud del ruido es aleatoria .

3. Métodos de supresión de ruido de imagen: filtro medio, filtro mediano, filtro preservador de límites

4. Filtro medio: En la imagen, los píxeles a procesar reciben una plantilla, que incluye los píxeles vecinos a su alrededor. El método de reemplazar el valor de píxel original con el valor promedio de todos los píxeles de la plantilla . La desventaja del filtro medio es que difuminará la imagen porque trata todos los puntos por igual, mientras que distribuye los puntos de ruido, también distribuye los puntos del límite de la escena.

5. Filtro mediano: debido al ruido (como el ruido de sal y pimienta), el píxel en este punto es mucho más brillante (más oscuro) que los píxeles circundantes .

Si en una plantilla determinada, los píxeles se reorganizan de pequeños a grandes , entonces los puntos más brillantes u oscuros deben disponerse en ambos lados . Tomando el valor de gris del píxel en la posición media de la plantilla para reemplazar el valor del píxel a procesar (posición actual) puede lograr el propósito de filtrar el ruido .

\ 6. El núcleo del filtro de preservación de límites es determinar los puntos límite y los puntos no límite .

Capítulo 6 Mejora de la imagen

1. La mejora de la imagen es el uso de una serie de tecnologías para mejorar el efecto visual de una imagen o para transformar la imagen en una forma más adecuada para el análisis y procesamiento por humanos o máquinas.

2. A partir del alcance de la mejora, los métodos de mejora de la imagen se pueden dividir en mejora del dominio espacial y mejora del dominio de la frecuencia .

La mejora del dominio espacial consiste en procesar directamente cada píxel de la imagen ;

La mejora en el dominio de la frecuencia consiste en procesar los componentes espectrales de la imagen después de la transformada de Fourier y luego la transformada de Fourier inversa para obtener la imagen deseada.

3. Un estiramiento de contraste lineal: por la diferencia claro-oscuro (es decir, contraste ) para expandirse a la parte humana por preocupación enfatizada .

4. Ventana de nivel de grises: en realidad, una forma especial de ampliación de contraste lineal. Solo se conserva la parte interesante y el resto se establece en 0.

5. Ajuste de rango dinámico lineal: Al comprimir el rango dinámico, se puede expandir el rango de cambio de escala de grises de la parte en cuestión .

6. Ajuste de rango dinámico no lineal: Porque el mapeo lineal por partes del ajuste de rango dinámico lineal no es lo suficientemente suave .

Transformación logarítmica: expanda la parte oscura mientras suprime la parte brillante . En general más brillante
Transformación exponencial: oscurecimiento general;
Transformación de la ley de potencia: ajuste libre

7. Ecualización de histograma

Capítulo 7 Transformación geométrica de la imagen

La transformación geométrica de la imagen incluye la transformación de forma y la transformación de posición de la imagen.

La transformación de forma de la imagen se refiere a la ampliación, reducción y corte incorrecto de la imagen.

La transformación de posición de la imagen se refiere a la traducción, reflejo y rotación de la imagen.

Capítulo 8 Nitidez de imagen

El propósito de la nitidez de la imagen es mejorar los bordes y contornos detallados de la escena en la imagen. La función de la nitidez es mejorar el contraste de la escala de grises.

Porque los bordes y contornos están ubicados en el lugar donde el nivel de gris cambia de repente. Entonces, la realización del algoritmo de afilado se basa en la acción diferencial.

Capítulo 9 Transformación de imagen

La característica de la transformación matemática de la imagen radica en su base matemática precisa, que es la base de muchas técnicas de procesamiento de imágenes. Entre estas transformaciones, una se realiza en el dominio espacial. Otra transformación matemática importante es convertir la imagen originalmente definida en el espacio de la imagen en algún otro espacio (dominio de frecuencia) de alguna forma, y usar las propiedades únicas de la imagen de entrada en estos espacios para procesar la imagen de manera eficiente y rápida. análisis.

Las transformaciones más típicas son la transformada discreta de Fourier, la transformada de Gabor, la transformada de ondícula, la transformada discreta del coseno, la transformada KL, etc.

Ya sea una transformación matemática en el dominio espacial o la transformación matemática en el dominio de la frecuencia, tienen aplicaciones muy típicas e importantes en el análisis, filtrado, mejora, compresión y otros procesamientos de imágenes.

Capítulo 10 Codificación de imágenes

El contenido de investigación de la codificación de datos incluye métodos de representación, transmisión, transformación y codificación de datos, el propósito es reducir el espacio requerido para el almacenamiento de datos y el tiempo utilizado para la transmisión.

La codificación y compresión de imágenes consiste en transformar y combinar datos de imágenes de acuerdo con ciertas reglas, a fin de expresar la mayor cantidad de información de imágenes posible con la menor cantidad de códigos (símbolos) posible. bmp jpeg psd

Descripción general de OpenCV

para resumir

Hoy escribí esta nota de procesamiento de gráficos porque revisé el conocimiento y hablé sobre el caso de aplicación de la matriz en la estructura de datos .

Después de eso, estudiaré la codificación de video, específicamente la aplicación del procesamiento de imágenes. Mencioné los conceptos básicos de conversión de video y video digital cuando escribí una revisión de los conceptos básicos de la tecnología de cine y televisión digital , pero debido a que el contenido era demasiado, no se expandió, por lo que voy a escribir algunos conceptos básicos de conversión de video y video digital.

Dirección de actualización: GitHub

Para obtener más contenido, preste atención: CSDN , GitHub , Nuggets