O conteúdo do armazém do GitHub é mostrado na figura abaixo, bem-vindo para levantar questões e fazer perguntas na área de comentários ~
https://github.com/Jad-Goh/tt100k_2021
1. Conversão do formato do conjunto de dados TT100K
1. Use o arquivo tt100k2coco.py para converter o formato para coco.
2. Use a função read_name do arquivo move.py para criar três arquivos: train2017.txt, val2017.txt e test2017.txt de acordo com o formato coco; use a função move_file para criar o diretório correspondente e mova a imagem correspondente para o diretório correspondente. O formato do diretório é mostrado na figura abaixo.
2. Conversão do formato do conjunto de dados BDD100K
1. Use o arquivo bdd2yolo.py para converter o arquivo .xml em um arquivo .txt que atenda aos requisitos do formato yolo, conforme mostrado na figura abaixo:
Nota: descrição do formato
Formato VOC:
O conjunto de dados PASCAL VOC consiste em 5 partes: JPEGImages, Annotations, ImageSets, SegmentationClass e SegmentationObject.
JPEGImages : Armazena todas as imagens para treinamento e teste.
Anotações : Armazena os arquivos XML correspondentes aos rótulos de cada imagem
ImageSets : na pasta ImageSets, apenas a pasta principal é discutida desta vez, e há quatro arquivos de texto principais armazenados nesta pasta: test.txt , train.txt , trainval.txt , val.txt , que armazenam test O nome do arquivo da imagem do conjunto de treinamento, o nome do arquivo da imagem do conjunto de treinamento , o nome do arquivo da imagem do conjunto de validação de treinamento e o nome do arquivo da imagem do conjunto de validação .
SegmentationClass e SegmentationObject : Todas as imagens são armazenadas e são resultados de segmentação de imagem, que são inúteis para tarefas de detecção de alvo. A segmentação de classe marca a categoria de cada pixel. A segmentação de objetos marca a qual objeto cada pixel pertence
Link: https://www.jianshu.com/p/8b43094d5ed4
bbox está no formato xmin, ymin, xmax, ymax (sem normalização) .
Formato COCO:
Existem três arquivos .json e três arquivos .txt para salvar os caminhos de imagem e anotações correspondentes aos conjuntos de dados train, val e test. bbox está no formato x,y,w,h (sem normalização) .
Formato YOLO:
x,y,w,h (normalizado) .