Conversión de formato de conjunto de datos TT100K/BDD100K

El contenido del almacén de GitHub se muestra en la figura a continuación, bienvenido a plantear problemas y hacer preguntas en el área de comentarios ~

https://github.com/Jad-Goh/tt100k_2021

1. Conversión de formato de conjunto de datos TT100K

1. Use el archivo tt100k2coco.py para convertir el formato al formato coco.

2. Use la función read_name del archivo move.py para crear tres archivos: train2017.txt, val2017.txt y test2017.txt según el formato coco, use la función move_file para crear el directorio correspondiente y mueva la imagen correspondiente a el directorio correspondiente El formato del directorio es como se muestra en la figura a continuación.

2. Conversión de formato de conjunto de datos BDD100K

1. Use el archivo bdd2yolo.py para convertir el archivo .xml en un archivo .txt que cumpla con los requisitos del formato yolo, como se muestra en la siguiente figura:

Nota: descripción del formato

formato COV:

El conjunto de datos PASCAL VOC consta de 5 partes: JPEGImages, Annotations, ImageSets, SegmentationClass y SegmentationObject.

  • JPEGImages : almacena todas las imágenes para entrenamiento y prueba.

  • Anotaciones : Almacena los archivos XML correspondientes a las etiquetas de cada imagen

  • Conjuntos de imágenes : en la carpeta Conjuntos de imágenes, solo se analiza la carpeta Principal esta vez, y hay cuatro archivos de texto principales almacenados en esta carpeta: test.txt , train.txt , trainval.txt , val.txt , que almacenan test El nombre del archivo de la imagen del conjunto de entrenamiento, el nombre de archivo de la imagen del conjunto de entrenamiento , el nombre de archivo de la imagen del conjunto de validación de entrenamiento y el nombre de archivo de la imagen del conjunto de validación .

  • SegmentationClass y SegmentationObject : todas las imágenes se almacenan y todas son resultados de segmentación de imágenes, que son inútiles para las tareas de detección de objetivos. La segmentación de clase marca la categoría de cada píxel. La segmentación de objetos marca a qué objeto pertenece cada píxel

Enlace: https://www.jianshu.com/p/8b43094d5ed4

bbox está en formato xmin, ymin, xmax, ymax (sin normalización) .

Formato COCO:

Hay tres archivos .json y tres archivos .txt para guardar las rutas de imagen y las anotaciones correspondientes a los conjuntos de datos de tren, val y prueba. bbox está en formato x,y,w,h (sin normalización) .

Formato YOLO:

x,y,w,h (normalizado) .

Supongo que te gusta

Origin blog.csdn.net/Jad_Goh/article/details/129033999
Recomendado
Clasificación