Resumen de conjuntos de datos de código abierto de alta calidad relacionados con la clasificación de imágenes (con enlaces de descarga)

Editar: plataforma de mercado extremo

Conjunto de datos de flores

Dirección de descarga del conjunto de datos: http://m6z.cn/6rTT7n

El conjunto de datos contiene 4242 imágenes de flores. La recopilación de datos se basa en datos flicr, imágenes de google, imágenes de yandex. Este conjunto de datos se puede utilizar para identificar plantas a partir de fotografías. Las imágenes de datos se agrupan en cinco categorías: manzanilla, tulipán, rosa, girasol, diente de león. Hay alrededor de 800 fotos de cada categoría. Las fotos no son de alta resolución, alrededor de 320x240 píxeles. Las fotos no se reducen a un solo tamaño, tienen diferentes proporciones.

Conjunto completo de datos de automóviles

Dirección de descarga del conjunto de datos: http://m6z.cn/6rTTar

Este conjunto de datos fue utilizado por el documento CVPR 2015 "Un conjunto de datos automotrices a gran escala para la clasificación y validación detalladas". El conjunto de datos Composite Cars (CompCars) contiene datos de dos escenarios, incluidas imágenes de web-natural y de vigilancia-natural. Los datos de naturaleza web contienen 163 fabricantes de automóviles y 1.716 modelos de automóviles. En total, hay 136.726 imágenes de vehículos completos y 27.618 imágenes de autopartes. La imagen completa del automóvil está etiquetada con cuadros delimitadores y puntos de vista. Cada modelo de automóvil está marcado con cinco atributos, que incluyen velocidad máxima, desplazamiento, número de puertas, número de asientos y tipo de automóvil. Los datos de naturaleza de vigilancia consistieron en 50.000 imágenes de automóviles capturadas en vista frontal.

reconocimiento de escena interior

Dirección de descarga del conjunto de datos: http://m6z.cn/5PCpJ5

Este conjunto de datos son los datos originales proporcionados por el MIT. El reconocimiento de escenas en interiores es un problema abierto desafiante en la visión de alto nivel. La mayoría de los modelos de reconocimiento de escenas para exteriores funcionan mal en interiores. La principal dificultad es que mientras algunas escenas interiores (p. ej., pasillos) están bien caracterizadas por atributos espaciales globales, otras (p. ej., librerías) están mejor caracterizadas por los objetos que contienen. De manera más general, para resolver el problema del reconocimiento de escenas en interiores, necesitamos un modelo que pueda explotar la información discriminatoria local y global. La base de datos contiene 67 categorías de interior con un total de 15620 imágenes. El número de imágenes varía según la categoría, pero cada categoría tiene al menos 100 imágenes. Todas las imágenes están en formato jpg.

Un conjunto de datos de 90 imágenes de animales.

Dirección de descarga del conjunto de datos: http://m6z.cn/6rTTbJ

En este conjunto de datos hay 5400 imágenes de animales de 90 categorías diferentes. Este conjunto de datos se creó a partir de Google Images: https://images.google.com/. Todas las fotos se almacenarán en sus respectivas carpetas según sus categorías. Las categorías de animales incluyen: antílope, tejón, murciélago, oso, abeja, escarabajo, bisonte, jabalí, mariposa,
oruga de gato, chimpancé y más. Las imágenes en este conjunto de datos no tienen un tamaño fijo y pueden requerir un procesamiento posterior.

conjunto de datos de aviones

Dirección de descarga del conjunto de datos: http://m6z.cn/5X8CPy

El conjunto de datos contiene 10 000 imágenes de aviones y los datos se dividen en 3334 imágenes de entrenamiento, 3333 imágenes de validación y 3333 imágenes de prueba.

conjunto de datos de ropa

Dirección de descarga del conjunto de datos: http://m6z.cn/64EPUp

El conjunto de datos de ropa recopila un total de 5000 imágenes de 20 tipos de ropa. Este conjunto de datos se publica bajo una licencia de dominio público (CC0). Utilizamos tres formas diferentes de recopilar el conjunto de datos: Toloka, una plataforma de crowdsourcing; una iniciativa web de crowdsourcing en las redes sociales; Tagias, una empresa especializada en la recopilación de datos. El etiquetado se realizó manualmente usando un widget de IPython, mientras que corregimos los errores de etiquetado usando una red neuronal simple.

El conjunto de datos contiene 20 clases, incluidas camisetas (1011 artículos), mangas largas (699 artículos), pantalones (692 artículos), zapatos (431 artículos), camisas (378 artículos), vestidos (357 artículos), abrigos (312 artículos) , shorts (308 artículos), sombreros (171 artículos), faldas (155 artículos), blazers (109 artículos), etc.

Conjunto de datos de marcas registradas

Dirección de descarga del conjunto de datos: http://m6z.cn/6cb2HG

En este trabajo, construimos un conjunto de datos de logotipos a gran escala Logo-2K+, que cubre varias categorías de logotipos a partir de imágenes de logotipos del mundo real. Nuestro conjunto de datos de logotipo generado contiene 167 140 imágenes con 10 categorías raíz y 2341 clases.

Conjunto de datos Oficina-Hogar

Dirección de descarga del conjunto de datos: http://m6z.cn/5I6cFG

Office-Home es un conjunto de datos de referencia para la adaptación de dominios, que contiene 4 dominios, cada dominio consta de 65 categorías. Los cuatro dominios son: Arte: imágenes artísticas en forma de dibujos, pinturas, decoraciones, etc.; Imágenes prediseñadas: una colección de imágenes prediseñadas; Producto: imágenes de objetos sin fondo; y Mundo real: objetos capturados con un imagen de la cámara Contiene 15.500 imágenes, con una media de unas 70 imágenes por clase y un máximo de 99 imágenes por clase.

Conjunto de datos de imágenes de alimentos

Dirección de descarga del conjunto de datos: http://m6z.cn/6rdsSw

Este conjunto de datos contiene muchos subconjuntos diferentes de los datos completos de food-101. Con el fin de hacer un conjunto de entrenamiento más simple para el análisis de imágenes que CIFAR10 o MNIST, los datos incluyen versiones de las imágenes enormemente reducidas para pruebas rápidas. Los datos han sido reformateados como HDF5, específicamente Keras HDF5Matrix, para que puedan leerse fácilmente. El nombre de archivo indica el contenido del archivo. Por ejemplo


foodc101n1000_r384x384x3.h5 indica que hay 101 categorías , n=1000 imágenes y la resolución es 384x384x3 (RGB, uint8) la resolución es 32x32x1 (float32 de -1 a 1)

El primer objetivo con este conjunto de datos es clasificar imágenes desconocidas, pero más allá de eso, ver qué regiones/componentes de imágenes son importantes para la clasificación, identificar nuevos tipos de alimentos como combinaciones de etiquetas existentes, construir detectores de objetos que encuentren objetos similares en una escena.

Supongo que te gusta

Origin blog.csdn.net/Extremevision/article/details/126470702
Recomendado
Clasificación