Conversão de formato de conjunto de dados TT100K/BDD100K

O conteúdo do armazém do GitHub é mostrado na figura abaixo, bem-vindo para levantar questões e fazer perguntas na área de comentários ~

https://github.com/Jad-Goh/tt100k_2021

1. Conversão do formato do conjunto de dados TT100K

1. Use o arquivo tt100k2coco.py para converter o formato para coco.

2. Use a função read_name do arquivo move.py para criar três arquivos: train2017.txt, val2017.txt e test2017.txt de acordo com o formato coco; use a função move_file para criar o diretório correspondente e mova a imagem correspondente para o diretório correspondente. O formato do diretório é mostrado na figura abaixo.

2. Conversão do formato do conjunto de dados BDD100K

1. Use o arquivo bdd2yolo.py para converter o arquivo .xml em um arquivo .txt que atenda aos requisitos do formato yolo, conforme mostrado na figura abaixo:

Nota: descrição do formato

Formato VOC:

O conjunto de dados PASCAL VOC consiste em 5 partes: JPEGImages, Annotations, ImageSets, SegmentationClass e SegmentationObject.

  • JPEGImages : Armazena todas as imagens para treinamento e teste.

  • Anotações : Armazena os arquivos XML correspondentes aos rótulos de cada imagem

  • ImageSets : na pasta ImageSets, apenas a pasta principal é discutida desta vez, e há quatro arquivos de texto principais armazenados nesta pasta: test.txt , train.txt , trainval.txt , val.txt , que armazenam test O nome do arquivo da imagem do conjunto de treinamento, o nome do arquivo da imagem do conjunto de treinamento , o nome do arquivo da imagem do conjunto de validação de treinamento e o nome do arquivo da imagem do conjunto de validação .

  • SegmentationClass e SegmentationObject : Todas as imagens são armazenadas e são resultados de segmentação de imagem, que são inúteis para tarefas de detecção de alvo. A segmentação de classe marca a categoria de cada pixel. A segmentação de objetos marca a qual objeto cada pixel pertence

Link: https://www.jianshu.com/p/8b43094d5ed4

bbox está no formato xmin, ymin, xmax, ymax (sem normalização) .

Formato COCO:

Existem três arquivos .json e três arquivos .txt para salvar os caminhos de imagem e anotações correspondentes aos conjuntos de dados train, val e test. bbox está no formato x,y,w,h (sem normalização) .

Formato YOLO:

x,y,w,h (normalizado) .

Acho que você gosta

Origin blog.csdn.net/Jad_Goh/article/details/129033999
Recomendado
Clasificación