Conjuntos de dados - conjuntos de dados coletados e usados pessoalmente

prefácio

Esta é uma parte do conjunto de dados que usei em meu trabalho e estudo. Existem várias categorias, como segmentação semântica, reconhecimento de alvo e matting de retrato. Esta é apenas uma parte do conjunto de dados que usei. Há um pequena parte desses conjuntos de dados. A fonte é da Internet, e grande parte é coletada por mim.

1. Segmentação semântica

1. Segmentação da borda do livro

Este conjunto de dados marca o conjunto de dados da linha intermediária e da borda do livro. Os dados são marcados com labelme. O conjunto de dados tem 2.500 imagens, que são usadas para treinar a detecção de borda e o reconhecimento da linha central da digitalização de documentos. Já treinei com ENet antes e o efeito é muito bom. Um exemplo de rotulagem de conjunto de dados é o seguinte:

 

2. Pele do rosto humano

2.1 Rugas e olheiras (164 imagens)

O conjunto de dados marca a localização de rugas e bolsas sob os olhos, e o conjunto de dados possui uma imagem de máscara convertida, que pode ser usada para detecção de rugas na pele e detecção e segmentação de bolsas oculares em beleza médica. Para métodos e efeitos de treinamento, consulte meu blog anterior:

Realização da Detecção de Rugas, Posicionamento e Segmentação da Imagem da Face Baseada na Segmentação Semântica

2.2 Acne, eritema, sardas (221 fotos)

O conjunto de dados contém rótulos como acne, eritema e sardas, que podem ser usados ​​para treinar a segmentação de instância real, e cada alvo tem um ID exclusivo.

acne

 eritema

 sarda

2.3 Poros

 O conjunto de dados de poros contém apenas poros e só pode ser usado para segmentação semântica de treinamento.

3. O arquivo da foto é claro e binário

O conjunto de dados é usado para binarização clara de fotos de documentos. Em alguns aplicativos, essa função é chamada de modo de economia de tinta. As amostras são usadas para treinar o filtro. O efeito de treinamento pode ser usado em meu blog anterior:

Use o aprendizado profundo para resolver o problema de binarização de fundos complexos em documentos fotografados_Como binarizar imagens com fundos mais escuros

 

4. Detecção de sombra e segmentação de documentos fotografados

O conjunto de dados é marcado com labelme, marcando a parte sombreada do documento fotografado, que é utilizada para detecção de sombra e remoção da digitalização do documento fotografado, totalizando 1000 imagens.

5. Folha de teste

A folha de teste é coletada tirando fotos e o volume de dados é superior a 2 W, incluindo manuscritos e impressos à máquina. O objeto de dados marca apenas a borda e a linha de formulário no teste, e a linha de formulário é usada para extração de formulário. A ferramenta de anotação é labelme.

Cerca de 30.000 folhas de teste manuscritas também foram coletadas, que podem ser usadas para reconhecimento OCR manuscrito do médico:

 

2. Reconhecimento do alvo

1.1 telefone celular

O marcado é o celular, o formato dos dados é xml e o formato txt do yolo convertido, e são 2000 peças.

1.2 Capacete

 Os dados são marcados com cabeças usando capacetes e cabeças sem capacetes. O formato dos dados é xml e convertido para o formato yolo txt. Há um total de 7.800 imagens. O efeito de treinamento pode se referir ao meu blog anterior:

Detecção de uso de capacete - desde processamento de dados, dados de treinamento até implantação de modelo (com conjunto de dados, código de treinamento, código de implantação de modelo C++ que pode usar GPU)_c++ ipc para detectar capacete

1.3 Fogos de artifício

 Os dados são marcados com duas tags de chama aberta e fumaça. O formato dos dados é xml e o formato yolo txt convertido. Há um total de 7600 imagens. O efeito de treinamento pode se referir ao meu blog anterior:

Detecção de fogos de artifício baseada em Yolov5 - treinamento de modelo e implantação de C++ - implantação de yolov5 c++

1.4 Fumar

 Os dados são marcados com duas tags de cabeça e fumo. O formato dos dados é xml e o formato yolo txt convertido. Há um total de 4800 imagens.

1.5 Documentos fotográficos

A detecção de objeto de documento detecta dois objetos, um livro aberto duas vezes e um único documento. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

 único documento

livro duplo 

1.6 carteira de identidade

O conjunto de dados inclui a frente e o verso do cartão de identificação. A frente do cartão de identificação está marcada com a frente e a cabeça e a parte de trás do cartão de identificação está marcada com o verso e o emblema nacional. Existem quatro alvos no total . A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo. O efeito de treinamento pode se referir ao meu blog subsequente:

Digitalização de fotos de documentos - com base em C ++ e rede neural profunda para realizar o reconhecimento de documentos e digitalizar e restaurar documentos para papel A4 1 a 1

 

1.7 Cartão Bancário

O conjunto de dados inclui a frente e o verso do banco, logotipo da UnionPay, chip IC, um total de quatro alvos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

1.8 Passaporte

O passaporte é marcado com a primeira página do passaporte e o retrato da pessoa, num total de dois golos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

1.9 Passe de Hong Kong e Macau

O Hong Kong and Macau Pass é marcado com três alvos: a frente, a foto do perfil e a parte de trás. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

1.10 Autorização de Residência

A autorização de residência marcava o rosto frontal e o retrato da cabeça, num total de dois alvos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

1.11 Carteira de Habilitação

A carteira de motorista é marcada com a face frontal e o retrato da cabeça, totalizando dois alvos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

1.12 Carteira de Previdência Social

O cartão de previdência social é marcado com a foto do perfil, o logotipo da UnionPay, o cartão IC, a frente do cartão de previdência social, o verso do cartão de previdência social e o emblema nacional. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.

 

3. Recorte

1. Recorte de Retrato

São recortes de meio comprimento para recortes de retrato, cerca de 50.000 peças, e o formato é uma imagem de máscara, que antes era usada para fotos de identificação inteligente.

Ser atualizado......................

Acho que você gosta

Origin blog.csdn.net/matt45m/article/details/131247144
Recomendado
Clasificación