Conjunto de datos COCO de Dataset: introducción al conjunto de datos COCO, descarga y guía detallada sobre cómo usarlo

Introducción al conjunto de datos COCO


        El nombre completo de MS COCO es Microsoft Common Objects in Context, que se originó a partir del conjunto de datos Microsoft COCO financiado por Microsoft en 2014. Al igual que la competencia ImageNet, se considera una de las competencias más preocupadas y autorizadas en el campo de la visión por computadora
        El conjunto de datos COCO es un conjunto de datos grande y rico para la detección, segmentación y subtítulos de objetos. Este conjunto de datos tiene como objetivo la comprensión de la escena, principalmente interceptada de escenas diarias complejas, y la posición del objetivo en la imagen se calibra mediante una segmentación precisa. Las imágenes incluyen 91 tipos de objetos, 328.000 imágenes y 2.500.000 etiquetas. Hasta ahora, existe el conjunto de datos más grande para segmentación semántica, que proporciona 80 categorías, más de 330.000 imágenes, 200.000 de las cuales están etiquetadas, y el número de individuos en todo el conjunto de datos supera los 1,5 millones.

 

 Dirección del sitio web oficial: http://cocodataset.org

0. 80 categorías del conjunto de datos COCO: el conjunto de datos utilizado por el algoritmo YoloV3

persona  
bicicleta coche coche moto moto avión autobús tren camión barco barco semáforo boca de incendio señal de  
stop (señal de alto) parquímetro (parquímetro) banco (banco)  
pájaro (pájaro) gato (gato) perro (perro) caballo (caballo) oveja (oveja) vaca (ganado) elefante (elefante) oso (oso) ) cebra (cebra ) jirafa (jirafa)  
mochila (mochila) paraguas (paraguas) bolso (bolso) corbata (corbata) maleta (maleta)  
frisbee (frisbee) esquís (pies de esquí) snowboard (snowboard) pelota deportiva (pelota deportiva) cometa (cometa) bate de béisbol (bate de béisbol) guante de béisbol (guante de béisbol) patineta (monopatín) tabla de surf (tabla de surf) raqueta de tenis (raqueta de tenis) botella (botella) copa de vino (copa) taza (taza de té) tenedor (tenedor) cuchillo (cuchillo) cuchara (  
cuchara
) ) tazón (tazón)  
plátano (plátano) manzana (manzana) sándwich (sándwich) naranja (naranja) brócoli (brócoli) zanahoria (zanahoria) hot dog (hot dog) pizza (pizza) donut (donut dulce) pastel (pastel)
silla (silla) sofá (sofá) planta en maceta (planta en maceta) cama (cama) mesa de comedor (mesa) inodoro (inodoro) tvmonitor (televisión) computadora portátil (cuaderno) mouse (mouse) control remoto (control remoto) teclado (teclado) teléfono celular  
( teléfono)  
microondas (horno microondas) horno (horno) tostadora (tostadora) fregadero (fregadero) refrigerador (refrigerador) libro (libro) reloj (despertador) florero (florero) tijeras (tijeras) osito de peluche (osito de peluche) secador de pelo (
pelo secadora) cepillo de dientes (cepillo de dientes)

1. Importancia del conjunto de datos COCO


        El nombre completo de MS COCO es Microsoft Common Objects in Context y se originó a partir del conjunto de datos Microsoft COCO financiado por Microsoft en 2014. Al igual que el concurso ImageNet, se considera uno de los concursos más preocupados y autorizados en el campo de la visión por computadora.
        Después de que se suspendió la competencia ImageNet, la competencia COCO se ha convertido en el punto de referencia más autorizado e importante en los campos del reconocimiento y detección de objetivos, y también es el único en este campo que puede reunir a Google, Microsoft, Facebook y muchos de los principales fabricantes nacionales. e instituciones extranjeras, en un concurso en el que participan escuelas y destacadas empresas innovadoras. 
        Este conjunto de datos resuelve principalmente tres problemas: detección de objetivos, relación contextual entre objetivos y posicionamiento preciso de objetivos en 2 dimensiones. El conjunto de datos COCO tiene 91 categorías. Aunque hay menos categorías que ImageNet y SUN, hay más imágenes en cada categoría, lo que favorece la obtención de más capacidades en una escena específica en cada categoría. En comparación con PASCAL VOC, tiene más categorías. .e imágenes.

1. Desafío de detección de objetivos COCO 

  • El conjunto de datos COCO contiene 200.000 imágenes;
  • Más de 500.000 anotaciones de objetivos en 80 categorías, es la base de datos de detección de objetivos más publicitada;
  • El número promedio de objetos por imagen es 7,2 y estos son conjuntos de datos bien conocidos para los desafíos de detección de objetos.

 2. Características del conjunto de datos COCO

COCO es un conjunto de datos de detección, segmentación y subtítulos de objetos a gran escala. COCO tiene varias características:

 3. El tamaño y la versión del conjunto de datos.

Tamaño: 25 GB (comprimido)
Número de registros: 330.000 imágenes, 80 categorías de objetos, 5 etiquetas por imagen, 250.000 puntos clave.
         El conjunto de datos COCO se publica en dos partes: la primera parte se publicó en 2014, la última parte se publicó en 2015, la versión 2014: 82 783 de entrenamiento, 40 504 de validación y 40 775 imágenes de prueba, hay 270 000 personas segmentadas y 886 000 objetos segmentados. ; la versión de 2015: 165.482 trenes, 81.208 val y 81.434 imágenes de prueba.
(1) Para los datos de la versión 2014, hay un total de aproximadamente 20 G de imágenes y aproximadamente 500 M de archivos de etiquetas. El archivo de etiqueta marca la posición precisa del píxel de cada segmentación + las coordenadas precisas del cuadro delimitador, y su precisión es de dos dígitos después del punto decimal.

Descarga del conjunto de datos COCO

Dirección del sitio web oficial : http://cocodataset.org/#download

1. Descarga del conjunto de datos de 2014

train2014: http://images.cocodataset.org/zips/train2014.zip
val2014: http://images.cocodataset.org/zips/val2014.zip

http://msvocds.blob.core.windows.net/coco2014/train2014.zip

2. Descarga del conjunto de datos de 2017

http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip

Cómo utilizar el conjunto de datos COCO

1. Uso básico

 

 

Supongo que te gusta

Origin blog.csdn.net/asuf1364/article/details/131827710
Recomendado
Clasificación