[Processamento de imagem digital] Noções básicas de imagem digital -- com base no processamento de imagem digital

I. Introdução

        A base do processamento de imagem digital é baseada na aquisição de imagem digital. Aqui, apresentamos principalmente alguns conceitos básicos de imagens, incluindo formato de imagem, imagem de imagem, características matemáticas de imagens e processamento matemático básico de imagens

2. Elementos de percepção da imagem

        Principalmente duas partes: cor e brilho

Imagiologia do Olho Humano:

        Íris : Controla o diâmetro da pupila, que equivale à abertura e controla a quantidade de luz que entra;

        Lente : É equivalente a uma lente. Em teoria, a distância da imagem da imagem do olho humano pode ser considerada personalizada, e a deformação da lente pode alterar a distância focal, de modo a realizar a imagem de diferentes distâncias do objeto;

        Retina : Existem dois tipos de fotorreceptores: cones e bastonetes. Entre eles, o cone está localizado na fóvea da retina, localizada no eixo óptico.Quando o olho se volta para o estrabismo, ele também gira aqui. Cada cone está conectado a uma terminação nervosa, que é sensível à cor, e a imagem é onde o olho humano se concentra. Os bastonetes estão amplamente distribuídos na retina, vários bastonetes ligam uma terminação nervosa, não têm percepção de cores e são sensíveis à baixa iluminação, como a visão sob o luar, principalmente bastonetes são estimulados (adivinhe o motivo, devido ao diâmetro da pupila é maior sob brilho, então o alcance da luz que entra na lente é maior, e mais luz será transmitida para um alcance maior da retina. Neste momento, os cones recebem menos luz e os bastonetes recebem mais luz).      
        Células cone : Os cones são divididos em três tipos de células cone, que são divididas em cone S, cone M e cone L. O grau de ativação dos três tipos de células cone é diferente quando eles sentem diferentes comprimentos de onda de luz , então só então surgiu a sensação biológica da cor. Para a luz visível, a distribuição é

Pode-se ver que o cone L é mais sensível ao vermelho, o cone M é mais sensível ao verde e o cone S é mais sensível ao azul e roxo. Para a luz solar, é uma mistura de várias luzes visíveis, então o olho humano pensa que a luz solar é a luz branca, que também é a base do princípio das três cores primárias RBG. O branco não é uma cor física, a luz branca não existe e o branco é apenas um conceito dos seres vivos. 

Brilho e tons de cinza:

        No sentido físico real, o brilho se refere à intensidade da luz; enquanto a escala de cinza se refere a um intervalo discreto de brilho do mínimo ao máximo. A escala de cinza é relativa e muda relativamente. É determinada pelo brilho máximo e pelo intervalo de intervalo discreto. O olho humano realmente percebe o brilho como uma faixa dinâmica. Em teoria, o que o olho humano percebe é o valor de cinza. Em relação à saturação do brilho, como o valor da escala de cinza leva o brilho máximo como a escala de cinza máxima, a escala de cinza máxima acabará sendo a escala de cinza máxima que excede esse brilho, portanto, informações serão perdidas.

cor:

 

        RGB: De acordo com a análise anterior da imagem do olho humano, pode-se ver que vermelho, verde e azul são usados ​​como as três cores básicas, e o branco pode ser sintetizado. Ao mesmo tempo, amarelo, ciano e roxo podem ser sintetizados por combinando dois pares

        RGB reflexivo: A luz vista pelo olho humano é dividida em dois tipos, um é a luz direta (incluindo a luz transmitida por objetos transparentes) e o outro é a luz refletida, o que significa que o próprio objeto não emite luz e reflete sua luz. Para objetos de luz direta, a cor que vemos é a luz que ele emite e a síntese das cores é a síntese do RNG; para a física da luz refletida, a cor que vemos é a luz que ela reflete e a síntese de suas cores é o reflexo RGB, que é relativo à luz de preenchimento de luz branca. Por exemplo, uma luz de preenchimento azul é amarela. Neste ponto, há um triângulo de luz de preenchimento.

        Existem outros espaços de cores baseados em diferentes cores primitivas.

3. Amostragem e quantização de imagens

        Depois que a imagem é tirada pelo sensor óptico, a imagem de detecção pode ser obtida e depois convertida em uma imagem digital após o processamento. Uma imagem digital define seus dados por uma função bidimensional: y=f(x,y). onde y representa o valor de cinza em (x, y). x, y representam o intervalo de divisão discreta de seu plano de imagem bidimensional.

        Resolução da imagem: dividida em resolução espacial e resolução de brilho. A resolução espacial refere-se ao grau de divisão discreta do plano da imagem. Por exemplo, 10um*10um representa um pixel, que é a resolução espacial. O tamanho da resolução é 10um. Se a divisão for mais fina, o tamanho do pixel será menor. A resolução de brilho refere-se à divisão dos valores da escala de cinza. Se for 256, significa que as áreas mais claras e mais escuras estão divididas em 256 níveis. Se for 128, é relativamente menos fino. Quanto maior a resolução da escala de cinza, mais precisa é a representação do brilho.

        O valor de cinza do armazenamento digital da imagem geralmente é: L=2^{k}. Com base na notação binária, cada pixel é representado por um byte, então k é 8, e o intervalo de escala de cinza que pode ser representado é 0-255; se for representado por dois bytes, então k é 16, que pode representar 0-255 255 gama de 65535. Se o tamanho da imagem for M*N, então o tamanho de armazenamento é M*N*k bit, ou seja, m*N*k/8 bytes.

        dpi: o número de pixels por polegada, quanto maior o dpi, maior a precisão da imagem

4. Formato da imagem

formato bmp (BitMap):

        Formato de armazenamento bitmap; sem compressão, exceto resolução de cor selecionável; ordem de digitalização da esquerda para a direita, de cima para baixo

JEPG (grupo conjunto de especialistas fotográficos)

        A compactação com perdas é usada para remover informações redundantes, a compactação é relativamente alta, mas a qualidade da imagem pode ser melhor preservada

PNG(Gráficos de Rede Portáteis)

        Formato de armazenamento em grade portátil com capacidade de armazenamento relativamente pequena e alta taxa de compactação

tig(Tag Image File Format)

        O formato da imagem é relativamente complicado e raramente é visto. É usado para publicação, digitalização, mapeamento, etc.

5. Ferramentas matemáticas

        Serão utilizadas algumas ferramentas matemáticas básicas: probabilidade e estatística, álgebra linear, cálculo e outros conhecimentos.

                        

Acho que você gosta

Origin blog.csdn.net/weixin_43163656/article/details/127966732
Recomendado
Clasificación