prefácio
Esta é uma parte do conjunto de dados que usei em meu trabalho e estudo. Existem várias categorias, como segmentação semântica, reconhecimento de alvo e matting de retrato. Esta é apenas uma parte do conjunto de dados que usei. Há um pequena parte desses conjuntos de dados. A fonte é da Internet, e grande parte é coletada por mim.
1. Segmentação semântica
1. Segmentação da borda do livro
Este conjunto de dados marca o conjunto de dados da linha intermediária e da borda do livro. Os dados são marcados com labelme. O conjunto de dados tem 2.500 imagens, que são usadas para treinar a detecção de borda e o reconhecimento da linha central da digitalização de documentos. Já treinei com ENet antes e o efeito é muito bom. Um exemplo de rotulagem de conjunto de dados é o seguinte:
2. Pele do rosto humano
2.1 Rugas e olheiras (164 imagens)
O conjunto de dados marca a localização de rugas e bolsas sob os olhos, e o conjunto de dados possui uma imagem de máscara convertida, que pode ser usada para detecção de rugas na pele e detecção e segmentação de bolsas oculares em beleza médica. Para métodos e efeitos de treinamento, consulte meu blog anterior:
2.2 Acne, eritema, sardas (221 fotos)
O conjunto de dados contém rótulos como acne, eritema e sardas, que podem ser usados para treinar a segmentação de instância real, e cada alvo tem um ID exclusivo.
acne
eritema
sarda
2.3 Poros
O conjunto de dados de poros contém apenas poros e só pode ser usado para segmentação semântica de treinamento.
3. O arquivo da foto é claro e binário
O conjunto de dados é usado para binarização clara de fotos de documentos. Em alguns aplicativos, essa função é chamada de modo de economia de tinta. As amostras são usadas para treinar o filtro. O efeito de treinamento pode ser usado em meu blog anterior:
4. Detecção de sombra e segmentação de documentos fotografados
O conjunto de dados é marcado com labelme, marcando a parte sombreada do documento fotografado, que é utilizada para detecção de sombra e remoção da digitalização do documento fotografado, totalizando 1000 imagens.
5. Folha de teste
A folha de teste é coletada tirando fotos e o volume de dados é superior a 2 W, incluindo manuscritos e impressos à máquina. O objeto de dados marca apenas a borda e a linha de formulário no teste, e a linha de formulário é usada para extração de formulário. A ferramenta de anotação é labelme.
Cerca de 30.000 folhas de teste manuscritas também foram coletadas, que podem ser usadas para reconhecimento OCR manuscrito do médico:
2. Reconhecimento do alvo
1.1 telefone celular
O marcado é o celular, o formato dos dados é xml e o formato txt do yolo convertido, e são 2000 peças.
1.2 Capacete
Os dados são marcados com cabeças usando capacetes e cabeças sem capacetes. O formato dos dados é xml e convertido para o formato yolo txt. Há um total de 7.800 imagens. O efeito de treinamento pode se referir ao meu blog anterior:
1.3 Fogos de artifício
Os dados são marcados com duas tags de chama aberta e fumaça. O formato dos dados é xml e o formato yolo txt convertido. Há um total de 7600 imagens. O efeito de treinamento pode se referir ao meu blog anterior:
1.4 Fumar
Os dados são marcados com duas tags de cabeça e fumo. O formato dos dados é xml e o formato yolo txt convertido. Há um total de 4800 imagens.
1.5 Documentos fotográficos
A detecção de objeto de documento detecta dois objetos, um livro aberto duas vezes e um único documento. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
único documento
livro duplo
1.6 carteira de identidade
O conjunto de dados inclui a frente e o verso do cartão de identificação. A frente do cartão de identificação está marcada com a frente e a cabeça e a parte de trás do cartão de identificação está marcada com o verso e o emblema nacional. Existem quatro alvos no total . A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo. O efeito de treinamento pode se referir ao meu blog subsequente:
1.7 Cartão Bancário
O conjunto de dados inclui a frente e o verso do banco, logotipo da UnionPay, chip IC, um total de quatro alvos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
1.8 Passaporte
O passaporte é marcado com a primeira página do passaporte e o retrato da pessoa, num total de dois golos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
1.9 Passe de Hong Kong e Macau
O Hong Kong and Macau Pass é marcado com três alvos: a frente, a foto do perfil e a parte de trás. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
1.10 Autorização de Residência
A autorização de residência marcava o rosto frontal e o retrato da cabeça, num total de dois alvos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
1.11 Carteira de Habilitação
A carteira de motorista é marcada com a face frontal e o retrato da cabeça, totalizando dois alvos. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
1.12 Carteira de Previdência Social
O cartão de previdência social é marcado com a foto do perfil, o logotipo da UnionPay, o cartão IC, a frente do cartão de previdência social, o verso do cartão de previdência social e o emblema nacional. A ferramenta de rotulagem é labelImg e o formato de dados é xml e txt do yolo.
3. Recorte
1. Recorte de Retrato
São recortes de meio comprimento para recortes de retrato, cerca de 50.000 peças, e o formato é uma imagem de máscara, que antes era usada para fotos de identificação inteligente.
Ser atualizado......................