Introdução ao processamento de imagens

O processamento de imagens é a técnica de análise de imagens com computadores para obter os resultados desejados. Também conhecido como processamento de imagem. O processamento de imagens geralmente se refere ao processamento digital de imagens. Uma imagem digital refere-se a uma grande matriz bidimensional obtida por filmagem com câmeras industriais, câmeras de vídeo, scanners e outros equipamentos.Os elementos dessa matriz são chamados de pixels e seus valores são chamados de valores em escala de cinza . A tecnologia de processamento de imagens geralmente inclui três partes: compressão, aprimoramento e restauração de imagens, correspondência, descrição e reconhecimento .

perfil de imagem

O século 21 é uma era repleta de informações. Como base visual para a percepção humana do mundo, as imagens são um meio importante para o ser humano obter, expressar e transmitir informações . O processamento digital de imagens, ou seja, o processamento de imagens com computadores, tem uma curta história de desenvolvimento. A tecnologia de processamento digital de imagens teve origem na década de 1920, quando uma foto foi transmitida de Londres, Reino Unido, para Nova York, EUA, por meio de um cabo submarino, utilizando tecnologia de compressão digital. Em primeiro lugar, a tecnologia de processamento digital de imagens pode ajudar as pessoas a compreender o mundo de forma mais objetiva e precisa.O sistema visual humano pode ajudar os humanos a obter mais de 3/4 das informações do mundo exterior , e as imagens e gráficos são os portadores de todas as informações visuais. . O poder é muito alto e milhares de cores podem ser reconhecidas, mas em muitos casos, a imagem fica borrada ou até mesmo invisível ao olho humano. Através da tecnologia de aprimoramento de imagem, a imagem borrada ou mesmo invisível pode se tornar clara e brilhante.

Em um computador, as imagens podem ser divididas em quatro tipos básicos: imagens binárias, imagens em tons de cinza, imagens indexadas e imagens RGB em cores reais, de acordo com o número de cores e escalas de cinza. A maioria dos softwares de processamento de imagens oferece suporte a esses quatro tipos de imagens.

A Aliança Escola-Empresa da Internet das Coisas da China acredita que o processamento de imagens será um dos pilares importantes para o desenvolvimento da indústria da Internet das Coisas, e sua aplicação específica é a tecnologia de reconhecimento de impressões digitais.

método comum

1) Transformação de imagem : Como a matriz de imagens é grande, processá-la diretamente no domínio espacial envolve uma grande quantidade de cálculos. Portanto, vários métodos de transformação de imagem são frequentemente usados, como transformada de Fourier, transformada de Walsh, transformada discreta de cosseno e outras técnicas de processamento indireto, para converter o processamento do domínio espacial no processamento do domínio de transformação, o que pode não apenas reduzir a quantidade de cálculo, mas também obter um processamento mais eficaz (por exemplo, a transformada de Fourier pode realizar filtragem digital no domínio da frequência). A transformada wavelet, recentemente pesquisada no momento, possui boas características de localização tanto no domínio do tempo quanto no domínio da frequência, e também possui uma aplicação ampla e eficaz no processamento de imagens.

2) Codificação e compactação de imagens : A tecnologia de codificação e compactação de imagens pode reduzir a quantidade de dados que descrevem uma imagem (ou seja, o número de bits), de modo a economizar tempo de transmissão e processamento de imagens e reduzir a capacidade de memória ocupada. A compressão pode ser obtida sem distorção ou com distorção permitida. A codificação é o método mais importante na tecnologia de compressão e é a tecnologia mais antiga e relativamente madura na tecnologia de processamento de imagem.

3) Aprimoramento e restauração de imagens : O objetivo do aprimoramento e restauração de imagens é melhorar a qualidade da imagem, como remover ruído e melhorar a clareza da imagem. O aprimoramento da imagem não considera a causa da degradação da imagem e destaca a parte interessante da imagem. Por exemplo, o fortalecimento dos componentes de alta frequência da imagem pode tornar o contorno dos objetos na imagem claro e os detalhes óbvios; se fortalecer os componentes de baixa frequência, pode reduzir a influência do ruído na imagem. A restauração da imagem requer uma certa compreensão das razões da degradação da imagem. De modo geral, um "modelo de degradação" deve ser estabelecido de acordo com o processo de degradação e, em seguida, algum método de filtragem deve ser usado para restaurar ou reconstruir a imagem original.

4) Segmentação de imagens : A segmentação de imagens é uma das principais tecnologias no processamento digital de imagens. A segmentação de imagens consiste em extrair características significativas da imagem. As características significativas incluem bordas e regiões da imagem, que são a base para posterior reconhecimento, análise e compreensão da imagem. Embora muitos métodos de extração de bordas e segmentação de regiões tenham sido pesquisados, não existe um método eficaz que seja geralmente aplicável a várias imagens. Portanto, a pesquisa sobre segmentação de imagens ainda é aprofundada e é um dos pontos quentes no processamento de imagens.

5) Descrição da imagem : A descrição da imagem é um pré-requisito necessário para o reconhecimento e compreensão da imagem. Como a imagem binária mais simples, suas características geométricas podem ser usadas para descrever as características dos objetos.O método geral de descrição de imagens usa descrição de forma bidimensional, que possui dois tipos de descrição de limite e descrição de área. Recursos de textura bidimensional podem ser usados ​​para descrever imagens de textura especial. Com o desenvolvimento aprofundado da pesquisa em processamento de imagens, a pesquisa sobre a descrição tridimensional de objetos foi iniciada e métodos como descrição de volume, descrição de superfície e descrição generalizada de cilindro foram propostos.

6) Classificação (reconhecimento) de imagens : A classificação (reconhecimento) de imagens pertence à categoria de reconhecimento de padrões, seu conteúdo principal é realizar segmentação de imagens e extração de características após algum pré-processamento (aprimoramento, restauração, compressão) da imagem, de modo a realizar julgamento e classificação. A classificação de imagens geralmente adota métodos clássicos de reconhecimento de padrões, incluindo classificação estatística de padrões e classificação de padrões sintáticos (estruturais).Nos últimos anos, o reconhecimento de padrões difusos recentemente desenvolvido e a classificação de padrões de redes neurais artificiais também têm recebido cada vez mais atenção no reconhecimento de imagens.

imagem

Imagem binária

Uma matriz bidimensional de uma imagem binária consiste em apenas dois valores de 0 e 1, onde “0” representa preto e “1” representa branco. Como cada pixel (cada elemento da matriz) possui apenas dois valores possíveis, 0 e 1, o tipo de dados da imagem binária no computador é geralmente 1 bit binário. Imagens binárias são geralmente usadas para reconhecimento de digitalização (OCR) de texto e desenhos de linha e armazenamento de imagens de máscara.

Imagem em tons de cinza

A faixa de valores dos elementos da matriz da imagem em tons de cinza é geralmente [0, 255]. Portanto, seu tipo de dados é geralmente um número inteiro não assinado de 8 bits (int8), que é a imagem em tons de cinza 256 à qual as pessoas costumam se referir. "0" significa preto puro, "255" significa branco puro e o número no meio significa a cor de transição do preto para o branco. Em alguns softwares, as imagens em tons de cinza também podem ser representadas por tipos de dados de precisão dupla (duplo), a faixa de valores dos pixels é [0, 1], 0 representa preto, 1 representa branco e decimais entre 0 e 1 representam diferentes escalas de cinza . As imagens binárias podem ser consideradas um caso especial de imagens em tons de cinza.

imagem de índice

A estrutura do arquivo da imagem indexada é relativamente complicada e, além de armazenar a matriz bidimensional da imagem, também inclui uma matriz bidimensional chamada matriz de índice de cores MAP . O tamanho do MAP é determinado pelo intervalo de valores dos elementos da matriz que armazenam a imagem. Por exemplo, se o intervalo de valores dos elementos da matriz for [0, 255], o tamanho da matriz MAP é 256×3, representado por MAPA=[RGB]. Os três elementos em cada linha do MAPA especificam respectivamente os valores monocromáticos vermelho, verde e azul da cor correspondente na linha, e cada linha do MAPA corresponde a um valor cinza de um pixel na matriz da imagem. Por exemplo, se o valor de cinza de um pixel for 64, então o pixel tem uma relação de mapeamento com a 64ª linha no MAP, e a cor real do pixel na tela é determinada pela combinação [RGB] da 64ª linha. Ou seja, quando a imagem é exibida na tela, a cor de cada pixel é obtida pesquisando a matriz de índice de cores MAP, utilizando como índice o valor de cinza do pixel armazenado na matriz. O tipo de dados da imagem de índice é geralmente um número inteiro sem sinal de 8 bits (int8), e o tamanho da matriz de índice correspondente MAP é 256×3, portanto, a imagem de índice geral só pode exibir 256 cores ao mesmo tempo, mas alterando a matriz de índice, o tipo de cor pode ser ajustado. O tipo de dados da imagem de índice também pode ser um tipo de ponto flutuante de precisão dupla (duplo). Imagens indexadas geralmente são usadas para armazenar imagens com requisitos de cores relativamente simples. Por exemplo, papéis de parede com composição de cores relativamente simples no Windows são geralmente armazenados em imagens indexadas. Se a cor da imagem for mais complicada, imagens RGB verdadeiras devem ser usadas.

Imagem colorida RGB

Imagens RGB, assim como imagens indexadas, podem ser usadas para representar imagens coloridas. Como uma imagem indexada, ela usa uma combinação das cores primárias vermelha (R), verde (G) e azul (B) para representar a cor de cada pixel. Mas diferente da imagem de índice, o valor da cor de cada pixel da imagem RGB (representado pelas três cores primárias do RGB) é armazenado diretamente na matriz da imagem. Uma vez que a cor de cada pixel precisa ser representada por três componentes de R , G e B, M, N representam respectivamente o número de linhas e colunas da imagem, e três matrizes bidimensionais M x N representam respectivamente os três componentes de cor de R, G e B de cada pixel. O tipo de dados de uma imagem RGB é geralmente um número inteiro não assinado de 8 bits, que geralmente é usado para representar e armazenar uma imagem em cores reais e, claro, uma imagem em tons de cinza também pode ser armazenada.

Existem dois métodos de armazenamento para dados de imagens digitalizadas: armazenamento de bitmap (Bitmap) e armazenamento vetorial (Vetor)

Geralmente descrevemos imagens digitais pela resolução da imagem (ou seja, pixels) e número de cores. Por exemplo, uma imagem digital com resolução de 640*480 e cores de 16 bits consiste em 307200 (=640*480) pixels de 2^16=65536 cores.

Imagem bitmap: O método bitmap consiste em converter cada ponto de valor de pixel da imagem em dados. Quando a imagem é monocromática (apenas preto e branco e duas cores), os dados de 8 pontos de valor de pixel ocupam apenas um byte (um byte que é, 8 números binários, 1 número binário armazena o ponto de valor de pixel); A imagem de 16 cores (diferente da "cor de 16 bits" anterior) é armazenada em um byte para cada dois pontos de valor de pixel; cada ponto de valor de pixel do Imagem de 256 cores Armazenada em um byte. Isto permite uma descrição precisa das superfícies da imagem em vários modos de cores. As imagens bitmap compensam os defeitos das imagens vetoriais. Podem produzir imagens com ricas mudanças de cores e tons, que podem representar realisticamente a cena natural. Ao mesmo tempo, podem facilmente trocar arquivos entre diferentes softwares. Esta é a imagem bitmap. As vantagens; e suas desvantagens são que ele não pode produzir imagens 3D reais e ocorrerá distorção da imagem ao aplicar zoom e girar as imagens. Ao mesmo tempo, o tamanho do arquivo é grande e a demanda por memória e espaço no disco rígido também é alta. O método bitmap consiste em converter cada pixel da imagem em dados. Se for gravado com dados de 1 bit, poderá representar apenas 2 cores (2 ^ 1 = 2); se for gravado com 8 bits, poderá expressar 256 cores ou tons (2 ^ 8 = 256), então use O quanto mais elementos de bits houver, mais cores poderão ser expressas. Normalmente, as cores que usamos são 16 cores, 256 cores, aprimoradas de 16 bits e true color de 24 bits. De modo geral, true color refere-se a um modo de armazenamento de bitmap de 24 bits (2 ^ 24) adequado para imagens complexas e fotos reais. No entanto, à medida que a resolução e o número de cores aumentam, o espaço em disco ocupado pela imagem será bastante grande; além disso, devido ao processo de ampliação da imagem, a imagem ficará inevitavelmente desfocada e distorcida, e os pixels do a imagem ampliada ficará maior e se tornará um pixel "quadrado". As imagens capturadas com câmeras digitais e scanners são bitmaps.

Imagem vetorial: a imagem vetorial armazena a parte do contorno das informações da imagem, em vez de cada ponto de valor de pixel da imagem. Por exemplo, um padrão circular só precisa armazenar a posição das coordenadas e o comprimento do raio do centro do círculo, bem como a borda e a cor interna do círculo. A desvantagem deste método de armazenamento é que muitas vezes leva muito tempo para fazer alguns trabalhos complexos de análise e cálculo, e a velocidade de exibição da imagem é lenta; mas o zoom da imagem não será distorcido; o espaço de armazenamento da imagem é Muito pequeno. Portanto, os gráficos vetoriais são mais adequados para armazenar vários diagramas e projetos.

dados

O processamento de imagens é inseparável de dados básicos massivos e ricos, incluindo vídeo, imagens estáticas e outros formatos, como conjunto de dados de segmentação de Berkeley e benchmark 500 (BSDS500), banco de dados de imagens da Universidade Simon Fraser de diferentes objetos de iluminação, dados de reconhecimento facial de rede neural, CBCL -MIT StreetScenes (banco de dados do MIT Street View), etc.

Digitalizando

Transformar uma imagem que existe em sua forma natural em uma forma digital adequada para processamento computacional por meio do processo de amostragem e quantização. Uma imagem é representada dentro de um computador como uma matriz de números, e cada elemento da matriz é chamado de pixel. A digitalização de imagens requer equipamento especializado, sendo comumente utilizados vários equipamentos de digitalização eletrônicos e ópticos, bem como equipamentos de digitalização eletromecânicos e digitalizadores operados manualmente.

codificação de imagem

Codifique as informações da imagem para atender aos requisitos de transmissão e armazenamento. A codificação comprime a quantidade de informações em uma imagem, mas a qualidade da imagem permanece quase a mesma. Para este fim, a tecnologia de processamento analógico pode ser usada e depois codificada através da conversão analógico-digital, mas a maioria deles usa tecnologia de codificação digital. Os métodos de codificação incluem o método de processamento da imagem ponto por ponto e o método de aplicação de alguma transformação à imagem ou codificação com base em regiões e características. Modulação de código de pulso, modulação de código de pulso diferencial, códigos preditivos e várias transformações são técnicas de codificação comumente usadas.

Compressão de imagem

O volume de dados de uma imagem obtida por digitalização é muito grande, e uma imagem digital típica geralmente consiste em 500×500 ou 1000×1000 pixels. Se for uma imagem dinâmica, seu volume de dados será maior. Portanto, a compactação de imagens é muito necessária para armazenamento e transmissão de imagens.

Existem dois tipos de algoritmos de compactação para compactação de imagem, nomeadamente compactação sem perdas e compactação com perdas. O algoritmo de compressão sem perdas mais comumente usado pega a diferença dos valores de pixels adjacentes no espaço ou no tempo e depois codifica. Os códigos de comprimento de execução são exemplos de tais códigos compactados. A maioria dos algoritmos de compressão com perdas adota a forma de troca de imagens, como realizar a transformação rápida de Fourier ou a transformação discreta de cosseno na imagem. Tanto JPEG quanto MPEG, que têm sido usados ​​como padrões internacionais para compactação de imagens, são algoritmos de compactação com perdas. O primeiro é usado para imagens estáticas e o segundo para imagens dinâmicas. Todos eles são realizados por chips.

recuperação aprimorada

O objetivo do aprimoramento de imagem é melhorar a qualidade da imagem, como aumentar o contraste, remover desfoque e ruído, corrigir distorções geométricas, etc.; a restauração de imagem é uma técnica que tenta estimar a imagem original assumindo um modelo com desfoque ou barulho.

O aprimoramento de imagem pode ser dividido em método de domínio de frequência e método de domínio espacial de acordo com o método utilizado. O primeiro considera a imagem como um sinal bidimensional e realiza o aprimoramento do sinal com base na transformada bidimensional de Fourier. O uso da filtragem passa-baixa (ou seja, permitindo a passagem apenas de sinais de baixa frequência) pode remover o ruído da imagem; o uso da filtragem passa-alta pode melhorar os sinais de alta frequência, como bordas, e tornar as imagens desfocadas nítidas. Algoritmos de domínio espacial representativos incluem método de média local e filtragem mediana (tomando o valor de pixel intermediário na vizinhança local), etc., que podem ser usados ​​para remover ou enfraquecer o ruído [3]   .

A restauração inicial de imagens digitais também veio do conceito de domínio de frequência. O método moderno é um método algébrico, ou seja, para restaurar a imagem ideal resolvendo um grande sistema de equações.

O aprimoramento e a restauração de imagens com o objetivo de melhorar a qualidade da imagem são amplamente utilizados para algumas fotos difíceis de obter ou fotos obtidas em condições fotográficas muito ruins. Por exemplo, fotos da Terra ou de outros planetas tiradas do espaço, fotos biomédicas tiradas com microscópios eletrônicos ou raios X, etc.

O aprimoramento de imagem  torna uma imagem mais nítida ou a transforma em um formato mais adequado para análise humana ou de máquina. Ao contrário da restauração de imagens, o aprimoramento de imagens não requer um reflexo fiel da imagem original. Por outro lado, uma imagem que contém algum tipo de distorção, como linhas de contorno proeminentes, pode ser mais nítida do que a imagem original não distorcida. Os métodos de aprimoramento de imagem comumente usados ​​são: ① Processamento de histograma de nível de cinza: para fazer com que a imagem processada tenha melhor contraste em uma determinada faixa de cinza; ② Supressão de interferência: através de filtragem passa-baixa, média de múltiplas imagens e implementação de certos tipos Operador de domínio e outros processamentos para suprimir a interferência aleatória sobreposta na imagem; ③Afiação de bordas: através de filtragem passa-alta, operação diferencial ou algum tipo de transformação, o contorno do gráfico é aprimorado; ④Processamento de pseudo-cor: Converte imagens em preto e branco em imagens coloridas, para que as pessoas podem facilmente analisar e detectar as informações contidas nas imagens.

A restauração de imagens  remove ou reduz a degradação de diversas causas no processo de aquisição de imagens. Tais razões podem ser aberração ou desfocagem do sistema óptico, movimento relativo entre o sistema de câmara e o objecto, ruído do sistema electrónico ou óptico e turbulência atmosférica entre o sistema de câmara e o objecto. Existem dois métodos comumente usados ​​para restauração de imagens. Quando a natureza da imagem em si não é conhecida, o modelo matemático da fonte de degradação pode ser estabelecido e então o algoritmo de restauração pode ser implementado para remover ou reduzir a influência da fonte de degradação. Quando há conhecimento prévio sobre a própria imagem, um modelo da imagem original pode ser estabelecido, e então a imagem pode ser restaurada através da detecção da imagem original na imagem degradada observada.

A segmentação de imagem divide a imagem em algumas regiões não sobrepostas, cada região é um conjunto contínuo de pixels. Geralmente, são utilizados o método de área que divide pixels em áreas específicas e o método de limite que busca os limites entre áreas. O método de região executa a operação de limite de acordo com o contraste entre o objeto segmentado e o fundo e separa o objeto do fundo. Às vezes, uma segmentação satisfatória não pode ser obtida com um limiar fixo, e o limiar pode ser ajustado de acordo com o contraste local, que é chamado de limiar adaptativo. O método de limite utiliza diversas técnicas de detecção de borda, ou seja, detecta de acordo com o grande valor do gradiente na borda da imagem. Ambos os métodos podem utilizar as características de textura da imagem para obter a segmentação da imagem.

morfologia

O termo morfologia geralmente se refere ao ramo da biologia que trata da forma e estrutura de animais e plantas. O termo também é usado no contexto da morfologia matemática como uma ferramenta para extrair componentes de imagem que são úteis para representar e descrever a forma de regiões como limites, ossos e cascos convexos. Além disso, nos concentramos em técnicas morfológicas para pré e pós-processamento, como filtragem morfológica, desbaste e recorte.

Operações Básicas de Morfologia Matemática

Existem quatro operações básicas em morfologia matemática: corrosão, dilatação, abertura e fechamento. O método de morfologia matemática usa uma "sonda" chamada elemento estrutural para coletar informações da imagem. Quando a sonda está em constante movimento na imagem, a relação entre as várias partes da imagem pode ser examinada para compreender as características estruturais da imagem. No espaço contínuo, as operações de erosão, dilatação, abertura e fechamento da imagem em tons de cinza são expressas respectivamente como segue.

corrosão

A erosão "encolhe" ou "diminui" objetos em uma imagem binária. A forma e o grau de encolhimento são controlados por um elemento estruturante. Matematicamente, A é corroído por B, denotado como AΘB, definido como:

operação de corrosão

Em outras palavras, a erosão de A por B é o conjunto de posições de origem de todos os elementos estruturais, onde o B transladado e o fundo de A não estão sobrepostos.

expandir

Expansão

Dilatação é a operação de “alongar” ou “engrossar” uma imagem binária. Essa forma e grau específicos de espessamento são controlados por um conjunto denominado elementos estruturantes. Os elementos estruturais são geralmente representados por uma matriz de 0s e 1s. Matematicamente, a dilatação é definida como uma operação definida. A é inflado por B, denotado como A⊕B, definido como: Entre eles, Φ é um conjunto vazio e B é um elemento estrutural. Em suma, a dilatação de A por B é o conjunto de posições de origem de todos os elementos estruturais, onde o B mapeado e transladado se sobrepõe a pelo menos algumas partes de A. Esta translação de elementos estruturais durante a dilatação é semelhante às convoluções espaciais.

A expansão satisfaz a lei comutativa, ou seja, A⊕B=B⊕A. No processamento de imagens, estamos acostumados a deixar o primeiro operando de A⊕B ser uma imagem, e o segundo operando ser um elemento estrutural, e o elemento estrutural é muitas vezes muito menor que a imagem.

A expansão satisfaz a lei associativa, ou seja, A⊕(B⊕C)=(A⊕B)⊕C. Suponha que um elemento estrutural B possa ser expresso como a expansão de dois elementos estruturais B1 e B2, ou seja, B=B1⊕B2, então A⊕B=A⊕(B1⊕B2)=(A⊕B1)⊕B2, em em outras palavras, use B Expandir A é equivalente a primeiro expandir A com B1 e depois expandir o resultado anterior com B2. Dizemos que B pode ser decomposto em dois elementos estruturais, B1 e B2. A associatividade é importante porque o tempo necessário para calcular a dilatação é proporcional ao número de pixels diferentes de zero no elemento estruturante. Através da lei associativa, a decomposição de elementos estruturais e a posterior execução de operações de expansão com elementos subestruturais alcançarão frequentemente um aumento de velocidade muito objetivo.

ligar

operação aberta

A operação de abertura morfológica de A por B pode ser registrada como A?B. Esta operação é o resultado de A ser corroído por B e depois expandido e corroído por B, a saber:

A fórmula matemática para a operação de abertura é:

operação aberta

Dentre eles, ∪{·} refere-se à união de todos os conjuntos entre colchetes. Uma interpretação geométrica simples desta fórmula é: A−B é a união das translações do emparelhamento exato de B dentro de A. A operação de abertura morfológica remove completamente as regiões do objeto que não podem conter elementos estruturais, suaviza os contornos do objeto, quebra conexões estreitas e remove pequenas saliências.

fecho

A é registrado como A B por B operação de fechamento morfológico, que é o resultado primeiro da expansão e depois da corrosão:

Fechar operação

Geometricamente, AB é a união de todas as translações de B que não se sobrepõem a A. Assim como a operação de abertura, a operação de fechamento morfológico suaviza o contorno do objeto. Então, ao contrário da operação de abertura, a operação de fechamento geralmente conecta lacunas estreitas para formar curvas delgadas e preencher buracos menores que os elementos estruturais.

Com base nessas operações básicas, vários algoritmos práticos de morfologia matemática podem ser derivados e combinados, que podem ser usados ​​para analisar e processar a forma e a estrutura da imagem, incluindo segmentação de imagem, extração de recursos, detecção de limites, redução de ruído de imagem, aprimoramento e restauração de imagem, etc. .

análise de imagem

Extraia alguma medida, dado ou informação útil de uma imagem . O objetivo é obter algum tipo de resultado numérico, não produzir outra imagem . O conteúdo da análise de imagens se sobrepõe aos campos de pesquisa de reconhecimento de padrões e inteligência artificial, mas a análise de imagens é diferente do reconhecimento de padrões típico. A análise de imagens não se limita a classificar uma área específica de uma imagem em um número fixo de categorias, ela fornece principalmente uma descrição da imagem que está sendo analisada . Para tanto, é necessário utilizar tanto a tecnologia de reconhecimento de padrões quanto a base de conhecimento do conteúdo da imagem, ou seja, o conteúdo da expressão do conhecimento em inteligência artificial. A análise de imagens precisa usar o método de segmentação de imagens para extrair as características da imagem e, em seguida, descrevê-la simbolicamente. Esta descrição pode não apenas responder se existe um determinado objeto na imagem, mas também descrever detalhadamente o conteúdo da imagem.

Os vários conteúdos do processamento de imagens estão relacionados entre si. Um sistema prático de processamento de imagens geralmente combina e aplica diversas técnicas de processamento de imagens para obter os resultados desejados. A digitalização de imagens é o primeiro passo para transformar uma imagem em um formato adequado para processamento computacional. A tecnologia de codificação de imagem pode ser usada para transmitir e armazenar imagens. O aprimoramento e a restauração de imagens podem ser o objetivo final do processamento de imagens ou podem ser uma preparação para processamento posterior. As características da imagem obtidas por meio da segmentação da imagem podem ser utilizadas como resultado final, podendo também servir de base para a próxima análise da imagem.

A correspondência, descrição e reconhecimento de imagens compara e registra imagens, extrai características e inter-relações de imagens por meio de pontuação, obtém descrições simbólicas de imagens e, em seguida, compara-as com modelos para determinar sua classificação. A correspondência de imagens tenta estabelecer uma correspondência geométrica entre duas imagens, medindo o quão semelhantes ou diferentes elas são. A correspondência é usada para registro entre imagens ou entre imagens e mapas, como detectar mudanças em cenas entre fotos tiradas em momentos diferentes e descobrir a trajetória de objetos em movimento.

A extração de algumas métricas, dados ou informações úteis de imagens é chamada de análise de imagens. As etapas básicas da análise de imagem são dividir a imagem em algumas regiões não sobrepostas, cada região é um conjunto contínuo de pixels, medir suas propriedades e relacionamentos e, finalmente, comparar a estrutura de relacionamento da imagem obtida com o modelo que descreve a classificação da cena , para determinar seu tipo. A base do reconhecimento ou classificação é a semelhança das imagens. Uma similaridade simples pode ser definida pela distância no espaço de características da região. Outra medida de similaridade baseada nos valores dos pixels é a correlação das funções da imagem. O último tipo de similaridade definido em estruturas relacionais é denominado similaridade estrutural.

Segmentação, descrição e reconhecimento para fins de análise e compreensão de imagens serão utilizados em diversos sistemas automatizados, como reconhecimento de caracteres e padrões, montagem e inspeção de produtos com robôs, reconhecimento e rastreamento automático de alvos militares, reconhecimento de impressões digitais, fotografias de raios-X E processamento automático de amostras de sangue, etc. Nessas aplicações, muitas vezes é necessário aplicar de forma abrangente tecnologias como reconhecimento de padrões e visão computacional, e o processamento de imagens aparece mais como um pré-processamento.

A ascensão das aplicações multimídia promoveu enormemente a aplicação da tecnologia de compressão de imagens. As imagens, incluindo imagens dinâmicas, como fitas de vídeo, serão convertidas em imagens digitais, armazenadas no computador juntamente com texto, som e gráficos, e exibidas na tela do computador. A sua aplicação irá expandir-se para novos campos como a educação, a formação e o entretenimento.

aplicativo

fotografia e impressão

Processamento de imagens de satélite

Processamento de imagens médicas

Reconhecimento facial, reconhecimento de recursos (detecção facial, detecção de recursos, identificação facial)

Processamento de imagem de microscópio

Detecção de barreira de carro

software comum

Adobe Photoshop

Recursos de software: O software de processamento de imagem com maior popularidade e taxa de utilização.

Vantagens do software: Obtenha melhores resultados mais rapidamente com o software Adobe Photoshop CS padrão do setor, ao mesmo tempo que fornece novos recursos essenciais para design gráfico e web, fotografia e vídeo.

Comparação com software peer: Desta vez, a Adobe realmente trouxe grandes surpresas para os designers. O Photoshop CS adicionou muitas funções poderosas, especialmente para fotógrafos. Desta vez, ele rompeu bastante com a série anterior do Photoshop. O produto presta mais atenção às limitações do gráfico design e fortaleceu e rompeu muito a função de suporte da câmara escura digital.

Versão recente: Em 2 de novembro de 2016, a Adobe atualizou a versão mais recente do Photoshop CC 2017.

Adobe Ilustrador

Recursos de software : Ferramenta profissional de desenho vetorial com funções poderosas e interface amigável.

Vantagens do software: Quer você seja um designer e ilustrador profissional que produz rascunhos para impressão e publicação, um artista que produz imagens multimídia ou um produtor de páginas da Internet ou conteúdo on-line, você descobrirá que o Illustrator não é apenas uma ferramenta para produtos artísticos, mas também adequado para a maioria, desde pequenos projetos até grandes projetos complexos.

Comparação com software peer : a função é extremamente poderosa e a operação é bastante profissional. É bem compatível com outros softwares da Adobe, como Photoshop, Primere e Indesign, e tem vantagens óbvias no campo profissional.

Corel Draw

Recursos de software: design de interface amigável, amplo espaço, operação delicada. Boa compatibilidade.

Vantagem do software: A capacidade extraordinária de design é amplamente utilizada em muitos campos, como design de marcas registradas, criação de logotipos, desenho de modelos, desenho de ilustração, composição tipográfica e saída de separação de cores. A compatibilidade de arquivos líder de mercado e o conteúdo de alta qualidade ajudam você a transformar suas ideias em produções profissionais. Tudo, desde logotipos e emblemas distintos até materiais de marketing atraentes e gráficos da web atraentes.

Comparação com software peer : função poderosa, excelente compatibilidade, pode gerar diversos formatos compatíveis com outros softwares, mais fáceis de operar que o Illustrator e possui alta taxa de aplicação em pequenas e médias empresas nacionais de design publicitário.

Imagem de vaca

Recursos do software: Keniu Image é uma nova geração de software de processamento de imagem, com funções exclusivas como clareamento e remoção de acne, emagrecimento facial, cenas de estrelas, sobreposição de várias fotos, etc., e mais de 50 efeitos especiais fotográficos, que podem criar estúdio fotos profissionais de alto nível em segundos.

Vantagens do software: edição de fotos, beleza de retratos, calendário de cenas, adição de acessórios de marca d'água, adição de várias fontes artísticas, criação de imagens dinâmicas em flash, bonecos bobblehead, costura de várias imagens, todas as funções que as pessoas podem imaginar e fáceis de usar.

Comparação com software peer: calendário de cena, flash dinâmico, boneco bobblehead, etc. não estão disponíveis no software tradicional de processamento de imagem. Com Keniu Imaging, não há necessidade de habilidades profissionais para processar fotos como o Photoshop.

Mãos mágicas de sombra

Recursos de software: "nEO iMAGING"〖Light and Shadow Magic Hand〗 é um software para melhorar a qualidade de fotos digitais e efeitos de processamento. Simples e fácil de usar, você pode criar efeitos coloridos de fotografia de filme profissional sem qualquer tecnologia de imagem profissional.

Vantagem do software: Simule o efeito do filme reverso, torne o contraste da foto mais vívido e a cor mais brilhante, simule o efeito do processo negativo reverso, a cor é estranha e nova, simule o efeito de muitos tipos de filme preto e branco, em termos de contraste, contraste e fotos digitais completamente diferentes.

Comparação com software peer: É um software para melhoria da qualidade da foto e processamento personalizado. Simples e fácil de usar, todos podem criar lindas molduras para fotos, fotos artísticas, efeitos de filmes profissionais e é totalmente gratuito.

ACDSee

Recursos de software: Não importa o tipo de fotos que você tira - família e amigos, ou fotos artísticas tiradas como hobby - você precisa de um software de gerenciamento de fotos para organizá-las e visualizá-las, corrigi-las e compartilhá-las com rapidez e facilidade.

Vantagens do software: ACDSee 9 pode "obter fotos" rapidamente de qualquer dispositivo de armazenamento e usar o novo recurso de "pastas privadas" protegidas por senha para armazenar informações confidenciais.

Comparação com colegas: opções poderosas de e-mail, apresentações de slides, gravação de CD/DVD e ferramentas de álbum da web que facilitam o compartilhamento de fotos. Melhore as fotos com soluções rápidas, como remoção de olhos vermelhos, remoção de projeção de cores, ajustes de exposição e a ferramenta Photo Fix.

Macromídia Flash

Recursos de software: Uma ferramenta visual de design de página da web e gerenciamento de site que suporta a mais recente tecnologia da web, incluindo inspeção de HTML, controle de formato HTML, opções de formatação HTML, etc.

Vantagens do software: além de novos recursos de vídeo e animação, ele também oferece novos efeitos de desenho e melhor suporte a scripts, e também integra ferramentas populares de edição e codificação de vídeo, e também fornece software para permitir aos usuários testar conteúdo Flash em telefones celulares, etc. nova função.

Comparação com software peer: Na edição, você pode escolher o método de visualização ou o método de edição do código-fonte de sua preferência.

Animador GIF Ulead

Recursos do software: Software de produção de GIF animado publicado pela Youli Company, o plug-in integrado tem muitos efeitos especiais prontos que podem ser aplicados imediatamente, pode converter arquivos AVI em arquivos GIF animados e também pode otimizar imagens GIF animadas, o que pode fazer suas imagens GIF animadas colocadas em páginas da web perdem peso para que as pessoas possam navegar na web mais rapidamente.

Vantagens do software: Este é um software de produção de animação GIF muito útil, criado pela Ulead Systems.Inc. Ulead GIF Animator pode não apenas salvar uma série de imagens no formato de animação GIF, mas também gerar mais de 20 tipos de efeitos dinâmicos 2D ou 3D, que são suficientes para atender às suas necessidades de criação de animação na web.

Comparação com software peer: Diferente de outros formatos de arquivo gráfico, um arquivo GIF pode armazenar várias imagens, neste momento, o GIF exibirá as imagens armazenadas nele como uma apresentação de slides, formando assim um período de animação.

Repostado de: Enciclopédia Baidu - Verificação

Acho que você gosta

Origin blog.csdn.net/fuhanghang/article/details/132575220
Recomendado
Clasificación