Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

Autor e editor | Há três palavras

1 GAN e detecção de objectos

detecção do alvo é estimado para ser o maior no campo de praticantes de visão computacional, entre eles pequenas metas, grande atitude são todos quebra-cabeça clássico, GAN no que é realmente grande como nós começamos a organizar.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

Encontrar Faces minúsculo com GAN

Encontrar Faces minúsculo com GAN é um pouco cara para melhorar a rede de detecção de quadro borrão usando super-resolução (rede de super-resolução), pode ser difícil para melhorar os resultados do teste de definir rosto mais largo (Hard subconjunto) de.

Face Detection tem feito grandes progressos, mas ainda enfrenta dificuldades no pouco detecção de rosto 10 x 10 tamanho ou menor. Em ambiente sem restrições, o rosto de baixa resolução pode ser pequeno, e acompanhado por vagas, essas pessoas enfrentam a falta de detalhe da textura, detecção de face é um desafio. Se a imagem é amostrado diretamente, ele vai aumentar a quantidade de cálculo.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Encontrar as faces pequenas com rosto humano GAN, de alta resolução gerados a partir de uma mancha de baixa resolução cara gerado pelo emprego contra a rede (GAN), em seguida, a detecção de face, a FIG sua estrutura inteira, que pode ser visto, for detectado rosto é um gráfico cara também pode ser uma cara não-humano, para a determinação do discriminador de autenticidade, a robustez do algoritmo de detecção de face.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

A figura é um gerador, que compreende duas sub-redes: a rede de super-resolução e melhorar a rede. A super-resolução de rede (SRNs) compreende um super-dois, quatro vezes a amostragem, a amostragem para melhorar a qualidade da imagem. Improved Network (rede de refinamento) pode recuperar alguns dos detalhes na eliminação de uma imagem de amostra, gerando uma imagem de alta resolução afiada são classificados.

Para o produtor, a optimização alvo para a reconstrução da perda, em que G1 e G2 são a rede de amostragem e melhorar a rede.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

As imagens de baixa resolução gerados pela amostragem treinados para imagens uso de alta resolução gerados usando interpolação bicubic.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Vgg19 discriminador é um modelo, conforme mostrado acima, duas camadas totalmente ligadas compreendendo uma saída, um verdadeiro super-sub-imagens e uma imagem de identificação, e uma cara não-face é determinada.

Além padrão contra a perda, discriminação também inclui uma perda de classificação rosto humano e não-cara.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

A figura seguinte mostra a pequena cara sobre o resultado de detecção de face mais larga, e uma comparação de desempenho com a maioria do quadro corrente.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Integração do módulo de super-resolução no quadro é resolver o pequeno detecção de alvo uma boa idéia, que é gerado contra a rede devido ao excelente desempenho da geração, digno de atenção.

Referências

[1] Bai Y, Zhang Y, Ding H, et al. Encontrar minúsculos rostos na natureza com a rede contraditório generativa [C] // Proceedings da Conferência IEEE em Visão Computacional e Reconhecimento de Padrões. 2018: 21-30.

2 segmentação de imagens GAN

segmentação de imagens é um problema clássico, como resultado da segmentação é uma máscara, que tendem a perseguir natureza mais sofisticada dos resultados, bom para recuperar o atraso distribuição de dados GAN é que há um monte de espaço, começamos a organizar.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

GAN para Semi-Supervisionado Semantic Segmentação

O GAN apresentação para Semi-Supervisionado Semantic Segmentação é usado para gerar ideias para melhorar a precisão da rede contra a segmentação semântica, e para a semi-supervisionado ideia segmentação semântica.

Sabemos os resultados de segmentação semântica, muitas vezes requer o uso de CRF e outras técnicas de pós-processamento para melhorar a fim de obter um perfil mais realista, gerado contra a rede em si tem uma boa capacidade de gerar, pode ser usado para tentar melhorar os resultados.

A figura mostra a estrutura básica é que ele pode ser visto para além da divisão da rede de base, que compreende ainda uma rede de discriminação. Determinando rede é uma rede de convolução completa, que é um resultado do rótulo entrada e saída segmentação real é um mapa de probabilidade, cada valor de pixel indica que ele é derivado de um resultado previsão tag real.

Otimização julgamento objetivo é a seguinte:

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

S () denota a divisão de rede, D (.) É uma rede discriminador, yn = 1 quando os pixels da tag real.

 

Estes são supervisionados aprender usando métodos de treinamento, em seguida, quando o tempo de semi-supervisionado como fazê-lo? Neste modelo só pode obter os resultados e a partição discriminador gráfico de probabilidade, a própria igreja discriminador precisa de seus próprios padrões de bom e mau, para otimizar os seguintes objectivos:

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Nas fórmulas acima, Tsemi variável é um valor de limiar, para fazer sair o discriminadora mapa probabilidade binarizada, S (Xn) é o resultado da divisão, Yn é baseada sobre o resultado de previsão S (Xn), para que toda a fórmula sub-banda equivalente de uma máscara cruzada entropia. Claro que, para probabilidade discriminador estabilidade mapear apenas em tempo de treinamento supervisionado.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

A figura mostra o mapa de probabilidade, o mais brilhante quanto mais próximo que significa que a distribuição da etiqueta real, essas áreas efectivamente utilizadas para o trem modelo semi-supervisionado.

Ao usar metade dos dados de anotação para a formação, e benchmarking resultados do modelo são as seguintes:

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

No geral, esta é uma boa idéia, os autores também fácil de verificar a implementação de código aberto, github.com / hfslyc / AdvSemiSeg.

Referências

[1] Hung WC, Tsai YH, Liou YT, et al. aprendizagem contraditório para a segmentação semântica semi-supervisionado [J]. arXiv preprint arXiv: 1.802,07934 de 2018.

3 GAN e redução de ruído de imagem

geração de imagem e processo de transmissão são perturbados pelo ruído, o ruído da imagem é um problema muito básico, as vantagens naturais modelo fórmula GAN na distribuição do ruído é capturado. Além disso, a imagem deblurring, realce, super-resolução, todas as áreas de reparação, integração, etc. Nós ter resolvido um monte de conteúdo!

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

GAN-CNN baseada cego Denoiser

não está emparelhado ruído real e de dados livre de ruído, GCBD (GAN-CNN Based Cego Denoiser) método usa o GAN coletadas a partir do verdadeiro ruído com ruído na imagem com base no ruído de imagem é um grande problema enfrentado pelo aprendizado profundidade, o acesso aos pares reais Figura de ruído para treinamento do modelo.

Como todo o quadro, a entrada é "unpaired" tem o ruído de imagem (Imagens barulhento) e (Imagens limpo) imagens sem ruído e, em seguida, extrair o bloco de ruído de rede (Noisy Bloco Extraction) amostras a modelagem barulho e ruído na imagem, dados de imagem limpa e sem ruído em conjunto para formar um par de formação, treinando com Dncnn último quadro.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

A figura é gerado contra a configuração de rede específico. x ~ ruído é gerado, x é coletado ruído, o ruído gerado como se segue, muito real.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Juntos produzir o verdadeiro ruído final e gerado ruído irá ser utilizado e um par imagem limpa seguinte figura mostra alguns resultados experimentais, que pode ser visto bons resultados.

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Como "Tópicos para" GAN para detecção do alvo, segmentação de imagens, melhoria de imagem e outras questões para lutar ajudar?

 

Obter ruído real e imagem livre de ruído é a chave para aprender a profundidade de redução de ruído aplicada ao problema, vale a pena concentrar em maneiras GAN e outro modelo sem supervisão.

Referências

[1] Chen J, Chen J, H Chao, et al. cega imagem denoising com a rede contraditório generativa baseada ruído modelagem [C] // Proceedings da Conferência IEEE em Visão Computacional e Reconhecimento de Padrões. De 2018: 3155-3164.

 

4 Para mais índice do GAN

GAN quase todos os grandes planos em todo o campo visual, como aprender sistematicamente GAN-lo? Consulte a descrição abaixo.

"Tópicos para" aprender a gerar sistematicamente rede confronto GAN

Publicado 472 artigos originais · Louvor obteve 757 · Visualizações 1,61 milhões +

Acho que você gosta

Origin blog.csdn.net/weixin_42137700/article/details/104814230
Recomendado
Clasificación