图像分类相关优质开源数据集汇总(附下载链接)

编辑:极市平台

花卉数据集

数据集下载地址:http://m6z.cn/6rTT7n

该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。 照片分辨率不高,约为 320x240 像素。 照片不会缩小到单一尺寸,它们有不同的比例。

综合汽车数据集

数据集下载地址:http://m6z.cn/6rTTar

该数据集是被CVPR 2015 论文“用于细粒度分类和验证的大规模汽车数据集”所使用的。综合汽车 (CompCars) 数据集包含来自两个场景的数据,包括来自网络自然和监视自然的图像。 web-nature 数据包含 163 个汽车制造商和 1,716 个汽车型号。 总共有 136,726 张拍摄整车的图像和 27,618 张拍摄汽车零件的图像。 完整的汽车图像标有边界框和视点。 每个车型都标有五个属性,包括最大速度、排量、门数、座位数和汽车类型。 监控性质的数据包含在前视图中捕获的 50,000 张汽车图像。

室内场景识别

数据集下载地址:http://m6z.cn/5PCpJ5

该数据集是麻省理工学院提供的原始数据。室内场景识别是高层次视觉中一个具有挑战性的开放性问题。 大多数适用于室外场景的场景识别模型在室内领域表现不佳。主要困难在于,虽然一些室内场景(例如走廊)可以通过全局空间属性很好地表征,但其他的(例如书店)可以通过它们包含的对象更好地表征。 更一般地说,为了解决室内场景识别问题,我们需要一个可以利用局部和全局判别信息的模型。该数据库包含 67 个室内类别,共 15620 张图像。 图片的数量因类别而异,但每个类别至少有 100 张图片。 所有图片均为jpg格式。

90种动物图像数据集

数据集下载地址:http://m6z.cn/6rTTbJ

在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的:https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲虫,野牛,公猪,蝴蝶,猫
毛虫,黑猩猩等。该数据集中的图像大小不固定,可能需要后续的处理。

飞机数据集

数据集下载地址:http://m6z.cn/5X8CPy

数据集包含 10,000 张飞机图像,数据分为 3334 个训练图像、3333 个验证图像和 3333 个测试图像。

衣服数据集

数据集下载地址:http://m6z.cn/64EPUp

衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集: Toloka——众包平台;社交媒体上的网络众包计划; Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的,同时我们使用简单的神经网络纠正了标签错误。

数据集包含 20 个类,包括T 恤(1011 件),长袖(699 件),裤子(692 件),鞋子(431 件)衬衫(378 件),连衣裙(357 件),外套(312 件),短裤(308 件),帽子(171 件),裙子(155 件),西装外套(109 件)等。

商标数据集

数据集下载地址:http://m6z.cn/6cb2HG

在这项工作中,我们构建了一个大规模的 logo 数据集 Logo-2K+,它涵盖了来自真实世界 logo 图像的各种 logo 类别。 我们生成的徽标数据集包含 167,140 张图像,具有 10 个根类别和 2,341 个类别。

Office-Home数据集

数据集下载地址:http://m6z.cn/5I6cFG

Office-Home 是一个用于域适应的基准数据集,它包含 4 个域,每个域由 65 个类别组成。这四个领域是: 艺术——素描、绘画、装饰等形式的艺术形象;剪贴画——剪贴画图像的集合;产品——没有背景的物体图像;和真实世界——用普通相机拍摄的物体图像。它包含 15,500 张图像,平均每个类大约 70 张图像,一个类最多 99 张图像。

食物图像数据集

数据集下载地址:http://m6z.cn/6rdsSw

该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集,该数据包括图像的大规模缩小版本,以实现快速测试。数据已被重新格式化为 HDF5,特别是 Keras HDF5Matrix,这样可以轻松读取它们。文件名表示文件的内容。例如

foodc101n1000_r384x384x3.h5 表示有 101 个类别,n=1000 图像,分辨率为 384x384x3(RGB,uint8)
foodtestc101n1000r32x32x1.h5 表示数据是验证集的一部分,代表 101 个类别,n=1000 图像,分辨率为 32x32x1(float32 从 -1 到 1)

使用该数据集的第一个目标是对未知图像进行分类,但除此之外,还可以查看哪些区域/图像组件对进行分类很重要,将新类型的食物识别为现有标签的组合,构建对象检测器,可以在整个场景中找到相似的对象。

猜你喜欢

转载自blog.csdn.net/Extremevision/article/details/126470702
今日推荐