Introducción al conjunto de datos de segmentación de partes de objetos PartImageNet (segmentación de partes semánticas)

PartImageNet es un artículo publicado en ECCV2022, que propone un conjunto de datos de anotación de nivel de parte de objeto con la mayor cantidad de categorías e imágenes actuales.

PartImageNet: un gran conjunto de datos de piezas de alta calidad

papel:  https://arxiv.org/abs/2112.00933

código: https://github.com/TACJu/PartImageNet

El enlace de descarga del conjunto de datos se ha publicado en GitHub y se puede descargar.


El conjunto de datos PartImageNet contiene 158 categorías, con un total de imágenes 24095. Cada imagen contiene anotaciones a nivel de componente de un solo objeto. Un ejemplo de la anotación se muestra en la siguiente figura. 

La información de categoría específica de este conjunto de datos se muestra en la siguiente tabla. 158 subcategorías pertenecen a 11 categorías. El número de subcategorías en cada categoría se da entre paréntesis. Las categorías son las mismas. Tomando la categoría Pez como ejemplo, contiene 10 subcategorías, y las categorías de partes de objetos en cada categoría son Cabeza, Cuerpo, Aleta y Cola.

Entre las 158 clases, hay 118 clases de carrocería no rígida (como perros) y otras 40 son clases de carrocería rígida (como automóviles). Además, el conjunto de datos también proporciona información de clasificación más detallada, como se muestra en la siguiente figura. Ejemplo: Cuadrúpedo → Perro → Setter Gordon.


Para la tarea de Segmentación de la Parte Semántica, el conjunto de datos se divide en 85%, 5% y 10%, la información específica es la siguiente:

 Por cierto, eche un vistazo a los indicadores de rendimiento de los métodos existentes en esta tarea, de la siguiente manera:


Para la tarea de aprendizaje de pocos disparos, el conjunto de datos se divide según el número de categorías 109, 19 y 30. La información específica es la siguiente:

Supongo que te gusta

Origin blog.csdn.net/u013685264/article/details/126059908
Recomendado
Clasificación