[Procesamiento de imágenes digitales] Conceptos básicos de imágenes digitales: basado en el procesamiento de imágenes digitales

I. Introducción

        La base del procesamiento de imágenes digitales se basa en la adquisición de imágenes digitales. Aquí presentamos principalmente algunos conceptos básicos de imágenes, incluido el formato de imagen, la imagen de imagen, las características matemáticas de las imágenes y el procesamiento matemático básico de las imágenes.

2. Elementos de la percepción de la imagen

        Principalmente dos partes: color y brillo.

Imágenes del ojo humano:

        Iris : controla el diámetro de la pupila, que es equivalente a la apertura y controla la cantidad de luz que ingresa;

        Lente : es equivalente a una lente.En teoría, la distancia de la imagen de la imagen del ojo humano se puede considerar personalizada, y la deformación de la lente puede cambiar la distancia focal, para realizar la imagen de diferentes distancias del objeto;

        Retina : Hay dos tipos de fotorreceptores: conos y bastones. Entre ellos, el cono se encuentra en la fóvea de la retina, que se encuentra en el eje óptico, cuando el ojo gira para entrecerrar los ojos, también girará aquí. Cada cono está conectado a una terminación nerviosa, que es sensible al color, y la imagen es donde enfoca el ojo humano. Los bastones están ampliamente distribuidos en la retina, varios bastones unen una terminación nerviosa, no tienen percepción del color y son sensibles a la iluminación baja, como la visión bajo la luz de la luna, principalmente se estimulan los bastones (adivina la razón, debido al diámetro de la pupila es más grande bajo el brillo, por lo que el rango de luz que ingresa a la lente es más grande y se transmitirá más luz a un rango más grande de la retina. En este momento, los conos reciben menos luz y los bastones reciben más luz).      
        Células de cono : los conos se dividen en tres tipos de células de cono, que se dividen en cono S, cono M y cono L. El grado de activación de los tres tipos de células de cono es diferente cuando sienten diferentes longitudes de onda de luz , así que sólo entonces surgió la sensación biológica del color. Para la luz visible, la distribución es

Se puede ver que el cono L es más sensible al rojo, el cono M es más sensible al verde y el cono S es más sensible al azul y al violeta. La luz solar es una mezcla de varias luces visibles, por lo que el ojo humano piensa que la luz solar es luz blanca, que también es la base del principio de los tres colores primarios RBG. El blanco no es un color físico, la luz blanca no existe y el blanco es solo un concepto de los seres vivos. 

Brillo y escala de grises:

        En el sentido físico real, el brillo se refiere a la intensidad de la luz, mientras que la escala de grises se refiere a un intervalo discreto de brillo desde el mínimo hasta el máximo. La escala de grises es relativa y cambia relativamente. Está determinada por el brillo máximo y el intervalo de intervalo discreto Decidir. El ojo humano en realidad percibe el brillo como un rango dinámico. En teoría, lo que el ojo humano percibe es el valor de gris. En cuanto a la saturación de brillo, debido a que el valor de la escala de grises toma el brillo máximo como la escala de grises máxima, la escala de grises máxima eventualmente será la escala de grises máxima que supere este brillo, por lo que se perderá información.

color:

 

        RGB: De acuerdo con el análisis previo de las imágenes del ojo humano, se puede ver que el rojo, el verde y el azul se utilizan como los tres colores básicos, y se puede sintetizar el blanco. Al mismo tiempo, el amarillo, el cian y el púrpura se pueden sintetizar mediante combinando dos pares

        RGB reflectante: la luz que ve el ojo humano se divide en dos tipos, una es luz directa (incluida la luz transmitida por objetos transparentes) y la otra es luz reflejada, lo que significa que el objeto en sí no emite luz y refleja su luz. Para objetos de luz directa, el color que vemos es la luz que emite, y la síntesis de colores es la síntesis de RNG; para la física de la luz reflejada, el color que vemos es la luz que refleja, y la síntesis de sus colores es el reflejo RGB, que es relativo a la luz de relleno de luz blanca. Por ejemplo, una luz de relleno azul es amarilla. En este punto hay un triángulo de luz de relleno.

        Hay otros espacios de color basados ​​en diferentes colores primitivos.

3. Muestreo y cuantificación de imágenes

        Después de que el sensor óptico toma la imagen, se puede obtener la imagen de detección y luego convertirla en una imagen digital después del procesamiento. Una imagen digital define sus datos mediante una función bidimensional: y=f(x,y). donde y representa el valor de gris en (x, y). x, y representan el intervalo de división discreta de su plano de imagen bidimensional.

        Resolución de imagen: dividida en resolución espacial y resolución de brillo. La resolución espacial se refiere al grado de división discreta del plano de la imagen. Por ejemplo, 10um*10um representa un píxel, que es la resolución espacial. El tamaño de la resolución es 10um. Si la división es más fina, el tamaño del píxel será menor. La resolución de brillo se refiere a la división de los valores de la escala de grises. Si es 256, significa que las áreas más brillantes y más oscuras se dividen en niveles 256. Si es 128, es relativamente menos fina. Cuanto mayor sea la resolución de la escala de grises, más fina será la representación del brillo.

        El valor gris de almacenamiento digital de la imagen es generalmente: L=2^{k}. Según la notación binaria, cada píxel está representado por un byte, entonces k es 8 y el rango de escala de grises que se puede representar es 0-255; si está representado por dos bytes, entonces k es 16, que puede representar 0- 255 rango de 65535. Si el tamaño de la imagen es M*N, entonces el tamaño de almacenamiento es M*N*k bit, es decir, m*N*k/8 bytes.

        dpi: el número de píxeles por pulgada, cuanto mayor sea el dpi, mayor será la precisión de la imagen

4. Formato de imagen

formato bmp (mapa de bits):

        Formato de almacenamiento de mapa de bits; sin compresión excepto la resolución de color seleccionable; orden de escaneo de izquierda a derecha, de arriba a abajo

JEPG (Grupo conjunto de expertos en fotografía)

        La compresión con pérdida se usa para eliminar información redundante, la compresión es relativamente alta pero la calidad de la imagen se puede conservar mejor

Png (Gráficos de red portátiles)

        Formato de almacenamiento de red portátil con capacidad de almacenamiento relativamente pequeña y alta relación de compresión

tig (formato de archivo de imagen de etiqueta)

        El formato de la imagen es relativamente complicado y rara vez se ve. Se usa para publicar, escanear, mapear, etc.

5. Herramientas matemáticas

        Se utilizarán algunas herramientas matemáticas básicas: probabilidad y estadística, álgebra lineal, cálculo y otros conocimientos.

                        

Supongo que te gusta

Origin blog.csdn.net/weixin_43163656/article/details/127966732
Recomendado
Clasificación