Introducción al procesamiento de imágenes

El procesamiento de imágenes es la técnica de analizar imágenes con computadoras para lograr los resultados deseados. También conocido como procesamiento de imágenes. El procesamiento de imágenes generalmente se refiere al procesamiento de imágenes digitales. Una imagen digital se refiere a una gran matriz bidimensional obtenida al disparar con cámaras industriales, cámaras de video, escáneres y otros equipos. Los elementos de esta matriz se denominan píxeles y sus valores se denominan valores de escala de grises . La tecnología de procesamiento de imágenes generalmente incluye tres partes: compresión, mejora y restauración de imágenes, coincidencia, descripción y reconocimiento .

perfil de imagen

El siglo XXI es una era llena de información. Como base visual de la percepción humana del mundo, las imágenes son un medio importante para que los seres humanos obtengan, expresen y transmitan información . El procesamiento de imágenes digitales, es decir, el procesamiento de imágenes con computadoras, tiene una corta historia de desarrollo. La tecnología de procesamiento de imágenes digitales se originó en la década de 1920, cuando se transmitía una fotografía desde Londres, Reino Unido, a Nueva York, EE.UU., a través de un cable submarino, utilizando tecnología de compresión digital. En primer lugar, la tecnología de procesamiento de imágenes digitales puede ayudar a las personas a comprender el mundo de manera más objetiva y precisa. El sistema visual humano puede ayudar a los humanos a obtener más de 3/4 de la información del mundo exterior . Las imágenes y los gráficos son los portadores de toda la información visual. La potencia es muy alta y se pueden reconocer miles de colores, pero en muchos casos la imagen es borrosa o incluso invisible para el ojo humano. A través de la tecnología de mejora de imagen, la imagen borrosa o incluso invisible se puede volver clara y brillante.

En una computadora, las imágenes se pueden dividir en cuatro tipos básicos: imágenes binarias, imágenes en escala de grises, imágenes indexadas e imágenes RGB de color verdadero según la cantidad de colores y escalas de grises. La mayoría del software de procesamiento de imágenes admite estos cuatro tipos de imágenes.

La Alianza Escuela-Empresa de Internet de las Cosas de China cree que el procesamiento de imágenes será uno de los pilares importantes para el desarrollo de la industria de Internet de las Cosas, y su aplicación específica es la tecnología de reconocimiento de huellas dactilares.

método común

1) Transformación de imágenes : dado que la matriz de imágenes es grande, procesarla directamente en el dominio espacial implica una gran cantidad de cálculos. Por lo tanto, a menudo se utilizan varios métodos de transformación de imágenes, como la transformada de Fourier, la transformada de Walsh, la transformada de coseno discreto y otras técnicas de procesamiento indirecto, para convertir el procesamiento del dominio espacial en el procesamiento del dominio de transformación, que no solo puede reducir la cantidad. de cálculo, pero también obtener un procesamiento más efectivo (por ejemplo, la transformada de Fourier puede realizar filtrado digital en el dominio de la frecuencia). La transformada wavelet, que se está investigando recientemente, tiene buenas características de localización tanto en el dominio del tiempo como en el dominio de la frecuencia, y también tiene una aplicación amplia y eficaz en el procesamiento de imágenes.

2) Codificación y compresión de imágenes : la tecnología de codificación y compresión de imágenes puede reducir la cantidad de datos que describen una imagen (es decir, la cantidad de bits), para ahorrar tiempo de transmisión y procesamiento de imágenes y reducir la capacidad de memoria ocupada. La compresión se puede lograr sin distorsión o con distorsión permitida. La codificación es el método más importante en la tecnología de compresión y es la tecnología más temprana y relativamente madura en la tecnología de procesamiento de imágenes.

3) Mejora y restauración de imágenes : el propósito de la mejora y restauración de imágenes es mejorar la calidad de la imagen, como eliminar el ruido y mejorar la claridad de la imagen. La mejora de la imagen no considera la causa de la degradación de la imagen y resalta la parte interesante de la imagen. Por ejemplo, fortalecer los componentes de alta frecuencia de la imagen puede hacer que el contorno de los objetos en la imagen sea claro y los detalles obvios; si fortalece los componentes de baja frecuencia, puede reducir la influencia del ruido en la imagen. La restauración de imágenes requiere una cierta comprensión de las razones de la degradación de la imagen. En términos generales, se debe establecer un "modelo de degradación" de acuerdo con el proceso de degradación y luego se debe utilizar algún método de filtrado para restaurar o reconstruir la imagen original.

4) Segmentación de imágenes : la segmentación de imágenes es una de las tecnologías clave en el procesamiento de imágenes digitales. La segmentación de imágenes consiste en extraer las características significativas de la imagen, que incluyen bordes y regiones de la imagen, que es la base para un mayor reconocimiento, análisis y comprensión de la imagen. Aunque se han investigado muchos métodos de extracción de bordes y segmentación de regiones, no existe ningún método eficaz que sea generalmente aplicable a varias imágenes. Por lo tanto, la investigación sobre la segmentación de imágenes aún es profunda y es uno de los puntos calientes en el procesamiento de imágenes.

5) Descripción de la imagen : la descripción de la imagen es un requisito previo necesario para el reconocimiento y la comprensión de la imagen. Como la imagen binaria más simple, sus características geométricas se pueden utilizar para describir las características de los objetos. El método general de descripción de imágenes utiliza una descripción de forma bidimensional, que tiene dos tipos de descripción de límites y descripción de área. Se pueden utilizar características de textura bidimensionales para describir imágenes de texturas especiales. Con el profundo desarrollo de la investigación sobre el procesamiento de imágenes, se inició la investigación sobre la descripción de objetos tridimensionales y se propusieron métodos como la descripción de volumen, la descripción de superficies y la descripción generalizada de cilindros.

6) Clasificación (reconocimiento) de imágenes : La clasificación (reconocimiento) de imágenes pertenece a la categoría de reconocimiento de patrones. Su contenido principal es realizar la segmentación de imágenes y la extracción de características después de algún preprocesamiento (mejora, restauración, compresión) de la imagen, para realizar juicio y clasificación. La clasificación de imágenes a menudo adopta métodos clásicos de reconocimiento de patrones, incluida la clasificación de patrones estadísticos y la clasificación de patrones sintácticos (estructurales). En los últimos años, el reconocimiento de patrones difusos y la clasificación de patrones de redes neuronales artificiales recientemente desarrollados también han recibido cada vez más atención en el reconocimiento de imágenes.

imagen

Imagen binaria

Una matriz bidimensional de una imagen binaria consta de sólo dos valores de 0 y 1, donde "0" representa el negro y "1" representa el blanco. Dado que cada píxel (cada elemento de la matriz) tiene sólo dos valores posibles, 0 y 1, el tipo de datos de la imagen binaria en la computadora suele ser 1 bit binario. Las imágenes binarias se utilizan normalmente para el reconocimiento de escaneo (OCR) de texto y dibujos lineales y para el almacenamiento de imágenes de máscara.

Imagen en escala de grises

El rango de valores de los elementos de la matriz de imagen en escala de grises suele ser [0, 255]. Por lo tanto, su tipo de datos es generalmente un entero sin signo de 8 bits (int8), que es la imagen en escala de grises 256 a la que la gente suele referirse. "0" significa negro puro, "255" significa blanco puro y el número en el medio significa el color de transición del negro al blanco. En algunos software, las imágenes en escala de grises también se pueden representar mediante un tipo de datos de doble precisión (doble), el rango de valores de píxeles es [0, 1], 0 representa negro, 1 representa blanco y los decimales entre 0 y 1 representan diferentes escalas de grises. . Las imágenes binarias pueden considerarse como un caso especial de imágenes en escala de grises.

imagen de índice

La estructura de archivos de la imagen indexada es relativamente complicada: además de almacenar la matriz bidimensional de la imagen, también incluye una matriz bidimensional llamada matriz de índice de color MAP . El tamaño del MAP está determinado por el rango de valores de los elementos de la matriz que almacenan la imagen. Por ejemplo, si el rango de valores de los elementos de la matriz es [0, 255], el tamaño de la matriz MAP es 256 × 3, representado por MAP=[RGB]. Los tres elementos en cada fila del MAP especifican respectivamente los valores monocromáticos rojo, verde y azul del color correspondiente en la fila, y cada fila del MAP corresponde a un valor gris de un píxel en la matriz de la imagen. Por ejemplo, si el valor de gris de un píxel es 64, entonces el píxel tiene una relación de mapeo con la línea 64 en el MAPA, y el color real del píxel en la pantalla está determinado por la combinación [RGB] de la línea 64. Es decir, cuando la imagen se muestra en la pantalla, el color de cada píxel se obtiene buscando en la matriz de índice de color MAP utilizando el valor de gris del píxel almacenado en la matriz como índice. El tipo de datos de la imagen de índice es generalmente un entero sin signo de 8 bits (int8), y el tamaño de la matriz de índice MAP correspondiente es 256 × 3, por lo que la imagen de índice general solo puede mostrar 256 colores al mismo tiempo, pero cambiando En la matriz de índice, se puede ajustar el tipo de color. El tipo de datos de la imagen de índice también puede ser un tipo de punto flotante de doble precisión (doble). Las imágenes indexadas se utilizan generalmente para almacenar imágenes con requisitos de color relativamente simples. Por ejemplo, los fondos de pantalla con una composición de color relativamente simple en Windows generalmente se almacenan en imágenes indexadas. Si el color de la imagen es más complicado, se deben usar imágenes RGB en color verdadero.

Imagen en color RGB

Las imágenes RGB, al igual que las imágenes indexadas, se pueden utilizar para representar imágenes en color. Al igual que una imagen indexada, utiliza una combinación de colores primarios rojo (R), verde (G) y azul (B) para representar el color de cada píxel. Pero a diferencia de la imagen de índice, el valor de color de cada píxel de la imagen RGB (representado por los tres colores primarios de RGB) se almacena directamente en la matriz de la imagen, ya que el color de cada píxel debe estar representado por tres componentes de R , G y B, M, N representan respectivamente el número de filas y columnas de la imagen, y tres matrices bidimensionales M x N representan respectivamente los tres componentes de color de R, G y B de cada píxel. El tipo de datos de una imagen RGB es generalmente un entero sin signo de 8 bits, que generalmente se usa para representar y almacenar una imagen en color verdadero y, por supuesto, también se puede almacenar una imagen en escala de grises.

Hay dos métodos de almacenamiento para datos de imágenes digitalizadas: almacenamiento de mapas de bits (Bitmap) y almacenamiento vectorial (Vector)

Generalmente describimos las imágenes digitales por resolución de imagen (es decir, píxeles) y cantidad de colores. Por ejemplo, una imagen digital con una resolución de 640*480 y color de 16 bits consta de 307200 (=640*480) píxeles de 2^16=65536 colores.

Imagen de mapa de bits: el método de mapa de bits consiste en convertir cada punto de valor de píxel de la imagen en datos. Cuando la imagen es monocromática (solo blanco y negro y dos colores), los datos de 8 puntos de valor de píxel solo ocupan un byte (un byte que es decir, 8 números binarios, 1 número binario almacena el punto de valor de píxel); la imagen de 16 colores (diferente del "color de 16 bits" anterior) se almacena en un byte por cada dos puntos de valor de píxel; cada punto de valor de píxel del Imagen de 256 colores Almacenada en un byte. Esto permite una descripción precisa de las superficies de la imagen en varios modos de color. Las imágenes de mapa de bits compensan los defectos de las imágenes vectoriales. Pueden producir imágenes con colores intensos y cambios de tono, que pueden representar de manera realista la escena natural. Al mismo tiempo, pueden intercambiar archivos fácilmente entre diferentes programas. Esta es la imagen de mapa de bits. Las ventajas y desventajas son que no puede producir imágenes reales en 3D y se producirá distorsión de la imagen al hacer zoom y rotar las imágenes. Al mismo tiempo, el tamaño del archivo es grande y la demanda de memoria y espacio en el disco duro también es alta. El método de mapa de bits consiste en convertir cada píxel de la imagen en datos. Si se graba con datos de 1 bit, solo puede representar 2 colores (2^1=2); si se graba con 8 bits, puede expresar 256 colores o tonos (2^8=256), así que use The Cuantos más elementos de bits haya, más colores se podrán expresar. Normalmente los colores que utilizamos son 16 colores, 256 colores, 16 bits mejorados y colores verdaderos de 24 bits. En términos generales, el color verdadero se refiere a un modo de almacenamiento de mapa de bits de 24 bits (2 ^ 24) adecuado para imágenes complejas y fotografías reales. Sin embargo, a medida que aumentan la resolución y el número de colores, el espacio en disco ocupado por la imagen será bastante grande; además, debido al proceso de ampliación de la imagen, la imagen inevitablemente se volverá borrosa y distorsionada, y los píxeles de la imagen La imagen ampliada en realidad se hará más grande y se convertirá en un "cuadrado" de píxeles. Las imágenes capturadas con cámaras digitales y escáneres son mapas de bits.

Imagen vectorial: la imagen vectorial almacena la parte del contorno de la información de la imagen, en lugar de cada punto de valor de píxel de la imagen. Por ejemplo, un patrón circular solo necesita almacenar la posición de las coordenadas y la longitud del radio del centro del círculo, así como el borde y el color interior del círculo. La desventaja de este método de almacenamiento es que a menudo lleva mucho tiempo realizar algunos análisis y cálculos complejos, y la velocidad de visualización de la imagen es lenta; pero el zoom de la imagen no se distorsionará; el espacio de almacenamiento de la imagen es mucho más pequeña. Por lo tanto, los gráficos vectoriales son más adecuados para almacenar varios diagramas y proyectos.

datos

El procesamiento de imágenes es inseparable de datos básicos masivos y ricos, incluidos videos, imágenes estáticas y otros formatos, como el conjunto de datos de segmentación de Berkeley y el punto de referencia 500 (BSDS500), la base de datos de imágenes de diferentes objetos de iluminación de la Universidad Simon Fraser, datos de reconocimiento facial de redes neuronales, CBCL. -MIT StreetScenes (base de datos de MIT Street View), etc.

Digitalizando

Transforme una imagen que existe en su forma natural en una forma digital adecuada para el procesamiento por computadora mediante el proceso de muestreo y cuantificación. Una imagen se representa dentro de una computadora como una matriz de números, y cada elemento de la matriz se llama píxel. La digitalización de imágenes requiere equipos especializados; comúnmente se utilizan diversos equipos de escaneo electrónicos y ópticos, así como equipos de escaneo electromecánicos y digitalizadores operados manualmente.

codificación de imágenes

Codifique la información de la imagen para cumplir con los requisitos de transmisión y almacenamiento. La codificación comprime la cantidad de información de una imagen, pero la calidad de la imagen sigue siendo casi la misma. Para este fin, se puede utilizar tecnología de procesamiento analógico y luego codificar mediante conversión de analógico a digital, pero la mayoría utiliza tecnología de codificación digital. Los métodos de codificación incluyen el método de procesar la imagen punto por punto y el método de aplicar alguna transformación a la imagen o codificación basada en regiones y características. La modulación de código de pulso, la modulación de código de pulso diferencial, los códigos predictivos y diversas transformaciones son técnicas de codificación comúnmente utilizadas.

Compresión de imagen

El volumen de datos de una imagen obtenida mediante digitalización es muy grande y una imagen digital típica suele constar de 500×500 o 1000×1000 píxeles. Si es una imagen dinámica, su volumen de datos es mayor. Por lo tanto, la compresión de imágenes es muy necesaria para el almacenamiento y transmisión de imágenes.

Existen dos tipos de algoritmos de compresión para la compresión de imágenes, a saber, compresión sin pérdidas y compresión con pérdidas. El algoritmo de compresión sin pérdidas más utilizado toma la diferencia de los valores de píxeles adyacentes en el espacio o el tiempo y luego codifica. Los códigos de longitud de ejecución son ejemplos de dichos códigos comprimidos. La mayoría de los algoritmos de compresión con pérdida adoptan la forma de intercambio de imágenes, como realizar una transformada rápida de Fourier o una transformada de coseno discreta en la imagen. Tanto JPEG como MPEG, que se han utilizado como estándares internacionales para la compresión de imágenes, son algoritmos de compresión con pérdida. El primero se utiliza para imágenes estáticas y el segundo para imágenes dinámicas. Todos ellos están realizados mediante chips.

recuperación mejorada

El objetivo de la mejora de la imagen es mejorar la calidad de la imagen, como aumentar el contraste, eliminar el desenfoque y el ruido, corregir la distorsión geométrica, etc.; la restauración de la imagen es una técnica que intenta estimar la imagen original suponiendo un modelo con desenfoque o desenfoque conocido. ruido.

La mejora de la imagen se puede dividir en método de dominio de frecuencia y método de dominio espacial según el método utilizado. El primero considera la imagen como una señal bidimensional y realiza una mejora de la señal basada en la transformada de Fourier bidimensional. El uso del filtrado de paso bajo (es decir, permitir el paso sólo de señales de baja frecuencia) puede eliminar el ruido de la imagen; el uso del filtrado de paso alto puede mejorar las señales de alta frecuencia, como los bordes, y aclarar las imágenes borrosas. Los algoritmos representativos del dominio espacial incluyen el método de promedio local y el filtrado de mediana (tomar el valor de píxel intermedio en el vecindario local), etc., que pueden usarse para eliminar o debilitar el ruido [3]   .

La restauración temprana de imágenes digitales también surgió del concepto de dominio de frecuencia. El método moderno es un método algebraico, es decir, restaurar la imagen ideal resolviendo un gran sistema de ecuaciones.

La mejora y restauración de imágenes con el fin de mejorar la calidad de la imagen se utilizan ampliamente para algunas fotografías difíciles de obtener o fotografías obtenidas en muy malas condiciones de toma. Por ejemplo, fotografías de la Tierra u otros planetas tomadas desde el espacio, fotografías biomédicas tomadas con microscopios electrónicos o rayos X, etc.

La mejora de imagen  mejora la nitidez de una imagen o la transforma en una forma más adecuada para el análisis humano o mecánico. A diferencia de la restauración de imágenes, la mejora de imágenes no requiere un reflejo fiel de la imagen original. Por el contrario, una imagen que contiene algún tipo de distorsión, como líneas de contorno prominentes, puede ser más nítida que la imagen original sin distorsión. Los métodos de mejora de imagen comúnmente utilizados son: ①Procesamiento de histograma de nivel de grises: para hacer que la imagen procesada tenga un mejor contraste en un cierto rango de grises; ②Supresión de interferencias: mediante filtrado de paso bajo, promedio de múltiples imágenes e implementación de ciertos tipos de operadores de dominio y otros procesamientos para suprime la interferencia aleatoria superpuesta a la imagen; ③Nitidez de bordes: mediante filtrado de paso alto, operación diferencial o algún tipo de transformación, se mejora el contorno del gráfico; ④Procesamiento de pseudocolor: convierte imágenes en blanco y negro en imágenes en color, de modo que las personas pueden analizar y detectar fácilmente la información contenida en las imágenes.

La restauración de imágenes  elimina o reduce la degradación de diversas causas en el proceso de adquisición de imágenes. Tales razones pueden ser aberración o desenfoque del sistema óptico, movimiento relativo entre el sistema de cámara y el objeto, ruido del sistema electrónico u óptico y turbulencia atmosférica entre el sistema de cámara y el objeto. Hay dos métodos comúnmente utilizados para la restauración de imágenes. Cuando no se conoce la naturaleza de la imagen en sí, se puede establecer el modelo matemático de la fuente de degradación y luego se puede implementar el algoritmo de restauración para eliminar o reducir la influencia de la fuente de degradación. Cuando existe conocimiento previo sobre la imagen en sí, se puede establecer un modelo de la imagen original y luego se puede restaurar la imagen detectando la imagen original en la imagen degradada observada.

La segmentación de imágenes divide la imagen en algunas regiones que no se superponen, cada región es un conjunto continuo de píxeles. Generalmente se utiliza el método de área que divide los píxeles en áreas específicas y el método de límites que busca los límites entre áreas. El método de región realiza una operación de umbral de acuerdo con el contraste entre el objeto segmentado y el fondo, y separa el objeto del fondo. A veces no se puede obtener una segmentación satisfactoria con un umbral fijo y el umbral se puede ajustar de acuerdo con el contraste local, lo que se denomina umbral adaptativo. El método de límites utiliza varias técnicas de detección de bordes, es decir, detecta según el gran valor de gradiente en el borde de la imagen. Ambos métodos pueden utilizar las características de textura de la imagen para lograr la segmentación de la imagen.

morfología

El término morfología generalmente se refiere a la rama de la biología que se ocupa de la forma y estructura de animales y plantas. El término también se utiliza en el contexto de la morfología matemática como una herramienta para extraer componentes de imágenes que son útiles para representar y describir la forma de regiones como límites, huesos y cascos convexos. Además, nos centramos en técnicas morfológicas para el pre y posprocesamiento, como el filtrado, el adelgazamiento y el recorte morfológicos.

Operaciones básicas de morfología matemática

Hay cuatro operaciones básicas en morfología matemática: corrosión, dilatación, apertura y cierre. El método de morfología matemática utiliza una "sonda" llamada elemento estructural para recopilar información de la imagen. Cuando la sonda se mueve constantemente en la imagen, se puede examinar la relación entre varias partes de la imagen para comprender las características estructurales de la imagen. En el espacio continuo, las operaciones de erosión, dilatación, apertura y cierre de la imagen en escala de grises se expresan respectivamente de la siguiente manera.

corrosión

La erosión "encoge" o "adelgaza" los objetos en una imagen binaria. La forma y el grado de contracción están controlados por un elemento estructurante. Matemáticamente, A es corroído por B, denotado como AΘB, definido como:

operación de corrosión

En otras palabras, la erosión de A por B es el conjunto de posiciones de origen de todos los elementos estructurales, donde el B traducido y el fondo de A no se superponen.

expandir

Expansión

La dilatación es la operación de "alargar" o "engrosar" una imagen binaria. Esta forma particular y grado de espesamiento está controlado por una colección llamada elementos estructurantes. Los elementos estructurales suelen estar representados por una matriz de 0 y 1. Matemáticamente, la dilatación se define como una operación establecida. A está inflado por B, denotado como A⊕B, definido como: Entre ellos, Φ es un conjunto vacío y B es un elemento estructural. En resumen, la dilatación de A por B es el conjunto de posiciones de origen de todos los elementos estructurales, donde el B mapeado y traducido se superpone al menos a algunas partes de A. Esta traducción de elementos estructurales durante la dilatación es similar a las convoluciones espaciales.

La expansión satisface la ley conmutativa, es decir, A⊕B=B⊕A. En el procesamiento de imágenes, estamos acostumbrados a dejar que el primer operando de A⊕B sea una imagen, y el segundo operando es un elemento estructural, y el elemento estructural suele ser mucho más pequeño que la imagen.

La expansión satisface la ley asociativa, es decir, A⊕(B⊕C)=(A⊕B)⊕C. Supongamos que un elemento estructural B se puede expresar como la expansión de dos elementos estructurales B1 y B2, es decir, B=B1⊕B2, entonces A⊕B=A⊕(B1⊕B2)=(A⊕B1)⊕B2, en En otras palabras, usar B Expandir A equivale a expandir primero A con B1 y luego expandir el resultado anterior con B2. Decimos que B se puede descomponer en dos elementos estructurales, B1 y B2. La asociatividad es importante porque el tiempo necesario para calcular la dilatación es proporcional al número de píxeles distintos de cero en el elemento estructurante. A través de la ley asociativa, descomponer elementos estructurales y luego realizar operaciones de expansión con elementos subestructurales a menudo logrará un aumento de velocidad muy objetivo.

encender

operación abierta

La operación de apertura morfológica de A por B se puede registrar como A? B. Esta operación es el resultado de que A sea corroído por B y luego expandido y corroído por B, a saber:

La fórmula matemática para la operación de apertura es:

operación abierta

Entre ellos, ∪{·} se refiere a la unión de todos los conjuntos entre llaves. Una interpretación geométrica simple de esta fórmula es: A−B es la unión de las traslaciones de la coincidencia exacta de B dentro de A. La operación de apertura morfológica elimina completamente las regiones del objeto que no pueden contener elementos estructurales, suaviza los contornos del objeto, rompe conexiones estrechas y elimina pequeñas protuberancias.

cierre

A se registra como A B por B operación de cierre morfológico, que es el resultado de primero la expansión y luego la corrosión:

Cerrar operación

Geométricamente, A B es la unión de todas las traslaciones de B que no se superponen a A. Al igual que la operación de apertura, la operación de cierre morfológico suaviza el contorno del objeto. Luego, a diferencia de la operación de apertura, la operación de cierre generalmente conecta espacios estrechos para formar curvas delgadas y llena agujeros más pequeños que los elementos estructurales.

Con base en estas operaciones básicas, se pueden derivar y combinar varios algoritmos prácticos de morfología matemática, que se pueden usar para analizar y procesar la forma y estructura de la imagen, incluida la segmentación de la imagen, la extracción de características, la detección de límites, la reducción del ruido de la imagen, la mejora y restauración de la imagen, etc. .

análisis de imagen

Extraer alguna medida, dato o información útil de una imagen . El propósito es obtener algún tipo de resultado numérico, no producir otra imagen . El contenido del análisis de imágenes se superpone con los campos de investigación del reconocimiento de patrones y la inteligencia artificial, pero el análisis de imágenes es diferente del reconocimiento de patrones típico. El análisis de imágenes no se limita a clasificar un área específica de una imagen en un número fijo de categorías, sino que proporciona principalmente una descripción de la imagen que se analiza . Para ello, es necesario utilizar tanto la tecnología de reconocimiento de patrones como la base de conocimientos del contenido de la imagen, es decir, el contenido de la expresión del conocimiento en inteligencia artificial. El análisis de imágenes debe utilizar el método de segmentación de imágenes para extraer las características de la imagen y luego describir la imagen simbólicamente. Esta descripción no solo puede responder si hay un determinado objeto en la imagen, sino también describir en detalle el contenido de la imagen.

Los diversos contenidos del procesamiento de imágenes están relacionados entre sí. Un sistema de procesamiento de imágenes práctico suele combinar y aplicar varias técnicas de procesamiento de imágenes para obtener los resultados requeridos. La digitalización de imágenes es el primer paso para transformar una imagen en una forma adecuada para el procesamiento por computadora. La tecnología de codificación de imágenes se puede utilizar para transmitir y almacenar imágenes. La mejora y restauración de imágenes puede ser el propósito final del procesamiento de imágenes o puede ser una preparación para un procesamiento posterior. Las características de la imagen obtenidas mediante la segmentación de la imagen se pueden utilizar como resultado final y también como base para el siguiente análisis de la imagen.

La comparación, descripción y reconocimiento de imágenes compara y registra imágenes, extrae características e interrelaciones de las imágenes mediante puntuación, obtiene descripciones simbólicas de las imágenes y luego las compara con modelos para determinar su clasificación. El emparejamiento de imágenes intenta establecer una correspondencia geométrica entre dos imágenes, midiendo qué tan similares o diferentes son. La coincidencia se utiliza para el registro entre imágenes o entre imágenes y mapas, como detectar cambios en escenas entre imágenes tomadas en diferentes momentos y descubrir la trayectoria de objetos en movimiento.

Extraer algunas métricas, datos o información útiles de las imágenes se denomina análisis de imágenes. Los pasos básicos del análisis de imágenes son dividir la imagen en algunas regiones que no se superponen, cada región es un conjunto continuo de píxeles, medir sus propiedades y relaciones y, finalmente, comparar la estructura de relaciones de la imagen obtenida con el modelo que describe la clasificación de la escena. , para determinar su tipo. La base del reconocimiento o clasificación es la similitud de las imágenes. Una similitud simple puede definirse por la distancia en el espacio de características de la región. Otra medida de similitud basada en valores de píxeles es la correlación de funciones de imagen. El último tipo de similitud definida en estructuras relacionales se llama similitud estructural.

La segmentación, la descripción y el reconocimiento con fines de análisis y comprensión de imágenes se utilizarán en diversos sistemas automatizados, como el reconocimiento de caracteres y patrones, el ensamblaje e inspección de productos con robots, el reconocimiento y seguimiento automático de objetivos militares, el reconocimiento de huellas dactilares y las fotografías de rayos X. Y procesamiento automático de muestras de sangre, etc. En tales aplicaciones, a menudo es necesario aplicar tecnologías integrales como el reconocimiento de patrones y la visión por computadora, y el procesamiento de imágenes aparece más como un preprocesamiento.

El auge de las aplicaciones multimedia ha impulsado enormemente la aplicación de la tecnología de compresión de imágenes. Las imágenes, incluidas las imágenes dinámicas como las cintas de vídeo, se convertirán en imágenes digitales, se almacenarán en la computadora junto con texto, sonido y gráficos, y se mostrarán en la pantalla de la computadora. Su aplicación se expandirá a nuevos campos como la educación, la formación y el entretenimiento.

solicitud

fotografía e impresión

Procesamiento de imágenes satelitales

Procesamiento de imágenes médicas

Reconocimiento facial, reconocimiento de funciones (detección de rostros, detección de funciones, identificación de rostros)

Procesamiento de imágenes de microscopio

Detección de barreras de coches

software común

Adobe Photoshop

Características del software: El software de procesamiento de imágenes con mayor popularidad y tasa de utilización.

Ventajas del software: obtenga mejores resultados más rápido con el software Adobe Photoshop CS estándar de la industria, al tiempo que proporciona nuevas funciones esenciales para diseño gráfico y web, fotografía y vídeo.

Comparación con el software similar: esta vez Adobe realmente ha traído grandes sorpresas a los diseñadores. Photoshop CS ha agregado muchas funciones potentes, especialmente para los fotógrafos. Esta vez ha superado con creces la serie anterior de Photoshop. El producto presta más atención a las limitaciones de los gráficos. diseño, y ha fortalecido y superado en gran medida la función de soporte del cuarto oscuro digital.

Versión reciente: El 2 de noviembre de 2016, Adobe actualizó la última versión de su Photoshop CC 2017.

Ilustrador Adobe

Características del software : Herramienta profesional de dibujo vectorial con potentes funciones y una interfaz amigable.

Ventajas del software: Si usted es un diseñador e ilustrador profesional que produce borradores para impresión y publicación, un artista que produce imágenes multimedia o un productor de páginas de Internet o contenido en línea, descubrirá que Illustrator no es solo una herramienta para productos artísticos, sino También es adecuado para la mayoría, desde diseños pequeños hasta proyectos grandes y complejos.

Comparación con software similar : la función es extremadamente poderosa y el funcionamiento es bastante profesional. Es muy compatible con otros programas de Adobe, como Photoshop, Primere e Indesign, y tiene ventajas obvias en el campo profesional.

CorelDRAW

Características del software: diseño de interfaz amigable, amplio espacio, operación delicada. Buena compatibilidad.

Ventaja del software: la extraordinaria capacidad de diseño se utiliza ampliamente en muchos campos, como el diseño de marcas, la creación de logotipos, el dibujo de modelos, el dibujo de ilustraciones, la composición tipográfica y la separación de colores. La compatibilidad de archivos líder en el mercado y el contenido de alta calidad lo ayudan a convertir sus ideas en producciones profesionales. Todo, desde logotipos y emblemas distintivos hasta materiales de marketing llamativos y gráficos web atractivos.

Comparación con software similar : función poderosa, excelente compatibilidad, puede generar varios formatos compatibles con otro software, más fácil de operar que Illustrator y tiene una alta tasa de aplicación en las pequeñas y medianas empresas nacionales de diseño publicitario.

Imagen de vaca

Características del software: Keniu Image es una nueva generación de software de procesamiento de imágenes, con funciones únicas como blanqueamiento y eliminación del acné, adelgazamiento facial, escenas de estrellas, superposición de múltiples fotografías, etc., y más de 50 efectos especiales fotográficos, que pueden crear imágenes de estudio. Fotografías profesionales de alto nivel en segundos.

Ventajas del software: edición de fotografías, belleza de retratos, calendario de escenas, adición de accesorios de marcas de agua, adición de varias fuentes artísticas, creación de imágenes dinámicas con flash, muñecos bobblehead, unión de varias imágenes, todas las funciones que la gente pueda imaginar y fáciles de usar.

Comparación con software similar: el calendario de escenas, el flash dinámico, el muñeco bobblehead, etc. no están disponibles en el software de procesamiento de imágenes tradicional. Con Keniu Imaging, no hay necesidad de habilidades profesionales para procesar fotografías como Photoshop.

Manos mágicas de sombra

Características del software: "nEO iMAGING"〖Light and Shadow Magic Hand〗es un software para mejorar la calidad de las fotografías digitales y el procesamiento de efectos. Simple y fácil de usar, puede crear efectos de color de fotografía de películas profesionales sin ninguna tecnología de imagen profesional.

Ventaja del software: simule el efecto de la película inversa, haga que el contraste de la foto sea más vívido y el color más brillante, simule el efecto del proceso negativo inverso, el color es extraño y novedoso, simule el efecto de muchos tipos de películas en blanco y negro, en términos de contraste, contraste y fotografías digitales completamente diferentes.

Comparación con software similar: es un software para mejorar la calidad de las fotografías y su procesamiento personalizado. Simple y fácil de usar, todos pueden crear hermosos marcos de fotos, fotografías artísticas, efectos cinematográficos profesionales y es completamente gratis.

ACDVer

Funciones del software: No importa qué tipo de fotografías tome (familiares y amigos, o fotografías artísticas tomadas como pasatiempo), necesita un software de administración de fotografías para organizarlas, verlas, corregirlas y compartirlas rápida y fácilmente.

Ventajas del software: ACDSee 9 puede "obtener fotos" rápidamente desde cualquier dispositivo de almacenamiento y también puede utilizar la nueva función de "carpetas privadas" protegidas con contraseña para almacenar información confidencial.

Comparación con pares: potentes opciones de correo electrónico, presentaciones de diapositivas, grabación de CD/DVD y herramientas de álbumes web que hacen que compartir fotos sea muy sencillo. Mejore las fotografías con soluciones rápidas como la eliminación de ojos rojos, la eliminación de tintes de color, ajustes de exposición y la herramienta Photo Fix.

Flash Macromedia

Características del software: una herramienta visual de diseño de páginas web y administración de sitios web que admite la última tecnología web, incluida la inspección de HTML, el control de formato HTML, las opciones de formato HTML, etc.

Ventajas del software: además de nuevas funciones de video y animación, también proporciona nuevos efectos de dibujo y mejor compatibilidad con scripts, y también integra herramientas populares de edición y codificación de video, y también proporciona software para permitir a los usuarios probar contenido Flash en teléfonos móviles, etc. nueva función.

Comparación con software similar: al editar, puede elegir el método de visualización o el método de edición del código fuente que desee.

Ulead Animador GIF

Características del software: software de producción de GIF animados publicado por Youli Company, el complemento incorporado tiene muchos efectos especiales listos para usar que se pueden aplicar inmediatamente, puede convertir archivos AVI en archivos GIF animados y también puede optimizar imágenes GIF animadas, lo que puede hacer Las imágenes GIF animadas colocadas en páginas web pierden peso para que las personas puedan navegar por la web más rápidamente.

Ventajas del software: Este es un software de producción de animación GIF muy útil creado por Ulead Systems.Inc. Ulead GIF Animator no sólo puede guardar una serie de imágenes en formato de animación GIF, sino que también genera más de 20 tipos de efectos dinámicos 2D o 3D, que son suficientes para cumplir con sus requisitos para realizar animaciones web.

Comparación con software similar: a diferencia de otros formatos de archivos gráficos, un archivo GIF puede almacenar varias imágenes. En este momento, GIF mostrará las imágenes almacenadas en él a su vez como una presentación de diapositivas, formando así un período de animación.

Publicado desde: Enciclopedia Baidu - Verificación

Supongo que te gusta

Origin blog.csdn.net/fuhanghang/article/details/132575220
Recomendado
Clasificación