Explicar el conjunto de datos VOC en detalle

Enlace de video de apoyo para este video: https://www.bilibili.com/video/BV1ZL4y1p7Cz/

Primero, presentemos un conjunto de datos clásico: el conjunto de datos VOC. Acrónimo de Visual Object Class, su dirección oficial es http://host.robots.ox.ac.uk/pascal/VOC/.

Aunque todo el mundo está más inclinado a utilizar el conjunto de datos COCO que presentaremos más adelante, el conjunto de datos VOC también es muy importante y, a menudo, puede verlo en algunos documentos.

Encontrará que muchos de los conjuntos de datos anteriores están acompañados por la aparición de competencias. El organizador de la competición proporciona las imágenes del conjunto de datos de entrenamiento y las anotaciones del conjunto de datos de entrenamiento a los concursantes, y también proporciona las imágenes del conjunto de datos de prueba sin información de etiqueta a los concursantes. Por supuesto, la información de anotación de estas imágenes del conjunto de datos de prueba está en manos del organizador de la competencia. Luego, los concursantes juegan con el conjunto de datos de entrenamiento con información etiquetada, y luego usan el modelo manipulado para predecir el conjunto de datos de prueba sin información etiquetada, y envían la información etiquetada predicha a la competencia en la forma especificada por la competencia. Posteriormente, la parte de la competencia comparará los resultados de predicción enviados por los concursantes con los resultados marcados en sus propias manos, y luego calculará la tasa correcta de los datos enviados por los concursantes y finalmente clasificará los resultados de predicción de cada concursante.

El conjunto de datos de VOC también apareció con la competencia, porque la competencia se suspendió en 2012, por lo que el año en que se actualizó el conjunto de datos también finalizó en 2012.

archivo

Como puede ver en la imagen de arriba, hay concursos de 2005 a 2012, y cada concurso proporciona el conjunto de datos del año correspondiente. De esta manera, el conjunto de datos de VOC en realidad incluye conjuntos de datos de 8 años desde 2005 hasta 2012. 8 conjuntos de datos, ¿cómo debemos elegir el conjunto de datos de qué año?

Permítanme darles una conclusión primero y luego hablemos de por qué elegimos los conjuntos de datos de estos años.

La conclusión es que las personas están usando más conjuntos de datos de 2007 y 2012. En cuanto a la razón, déjame decirte.

archivo

En 2005, el organizador de la competencia VOC proporcionó el conjunto de datos VOC 2005. En ese momento, el conjunto de datos solo tenía 4 categorías objetivo, y la cantidad de conjuntos de datos era solo alrededor de 1500. En este momento, el conjunto de datos de VOC 2015 es relativamente pequeño en términos de la cantidad de imágenes en el conjunto de datos y los tipos de objetivos. Para 2006, el conjunto de datos VOC 2006 tenía 10 categorías y el número era de aproximadamente 2600.

Sin embargo, en 2007, el conjunto de datos VOC 2007 de repente tenía 20 categorías y la cantidad de conjuntos de datos también aumentó a alrededor de 9900.

archivo

El conjunto de datos VOC 2007 fue un gran punto de inflexión. El conjunto de datos en este momento puede cumplir con los requisitos de entrenamiento de la mayoría de los modelos en términos del tamaño del volumen de datos y la categoría del objetivo. Por lo tanto, encontrará que muchos modelos usan el conjunto de datos VOC 2007 para entrenar el modelo de red.

Sin embargo, en 2008, la fiesta de la competencia VOC comenzó a hacer cosas nuevamente. Rehicieron el conjunto de datos, por lo que el conjunto de datos VOC 2008 tiene 20 categorías y la cantidad de imágenes es de alrededor de 4000. Se puede encontrar mucho menos que el conjunto de datos VOC 2007. De 2009 a 2012, la cantidad de conjuntos de datos en 2008 se expandió continuamente. Para 2012, la cantidad de imágenes en el conjunto de datos llegó a 11,000.

Por lo tanto, es concebible que el conjunto de datos VOC 2012 sea muy atractivo para los investigadores.

La siguiente figura es una buena ilustración de los cambios en el conjunto de datos de VOC para cada año.

archivo

En la figura anterior, diferentes colores representan el contenido del conjunto de datos. Por ejemplo, los colores en 2005 y 2006 son diferentes, lo que indica que el contenido del conjunto de datos en 2005 y 2006 es completamente diferente. Se puede ver que 2005-07 es una etapa, en este momento, el contenido del conjunto de datos de cada año es diferente. Pero a partir de la introducción de ahora, se puede encontrar que el conjunto de datos de 2007 es superior en términos de número y tipos de imágenes, por lo que este conjunto de datos de 2005-07, VOC 2007 ganó con éxito.

Y de 2008 a 2012, fue una nueva etapa. En 2008, el conjunto de datos VOC restableció un nuevo conjunto de datos y luego continuó expandiéndose sobre la base de este conjunto de datos cada año. Para el 12/11, la cantidad y variedad de conjuntos de datos alcanzaron su punto máximo. Tenga en cuenta que en 2011 y 2012, la cantidad de imágenes y categorías en el conjunto de datos es la misma, pero en 2012, se realizaron algunas optimizaciones y mejoras en el etiquetado sobre la base de 11 años. Todos están más acostumbrados a que les guste el conjunto de datos de 12 años.

Entonces, en resumen, todos deberían entender por qué todos prefieren usar los conjuntos de datos de 2007 y 2012.

Tutorial sobre montículos de suelo, que respalda la serie de tutoriales en video sobre cómo comenzar con la detección de objetivos

Supongo que te gusta

Origin blog.csdn.net/xiaotudui/article/details/122163725
Recomendado
Clasificación