编辑：极市平台

花卉数据集

数据集下载地址：http://m6z.cn/6rTT7n

该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类：洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高，约为 320x240 像素。照片不会缩小到单一尺寸，它们有不同的比例。

综合汽车数据集

数据集下载地址：http://m6z.cn/6rTTar

该数据集是被CVPR 2015 论文“用于细粒度分类和验证的大规模汽车数据集”所使用的。综合汽车 (CompCars) 数据集包含来自两个场景的数据，包括来自网络自然和监视自然的图像。 web-nature 数据包含 163 个汽车制造商和 1,716 个汽车型号。总共有 136,726 张拍摄整车的图像和 27,618 张拍摄汽车零件的图像。完整的汽车图像标有边界框和视点。每个车型都标有五个属性，包括最大速度、排量、门数、座位数和汽车类型。监控性质的数据包含在前视图中捕获的 50,000 张汽车图像。

室内场景识别

数据集下载地址：http://m6z.cn/5PCpJ5

该数据集是麻省理工学院提供的原始数据。室内场景识别是高层次视觉中一个具有挑战性的开放性问题。大多数适用于室外场景的场景识别模型在室内领域表现不佳。主要困难在于，虽然一些室内场景（例如走廊）可以通过全局空间属性很好地表征，但其他的（例如书店）可以通过它们包含的对象更好地表征。更一般地说，为了解决室内场景识别问题，我们需要一个可以利用局部和全局判别信息的模型。该数据库包含 67 个室内类别，共 15620 张图像。图片的数量因类别而异，但每个类别至少有 100 张图片。所有图片均为jpg格式。

90种动物图像数据集

数据集下载地址：http://m6z.cn/6rTTbJ

在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的：https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括：羚羊，獾，蝙蝠，熊，蜜蜂，甲虫，野牛，公猪，蝴蝶，猫
毛虫，黑猩猩等。该数据集中的图像大小不固定，可能需要后续的处理。

飞机数据集

数据集下载地址：http://m6z.cn/5X8CPy

数据集包含 10,000 张飞机图像，数据分为 3334 个训练图像、3333 个验证图像和 3333 个测试图像。

衣服数据集

数据集下载地址：http://m6z.cn/64EPUp

衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集： Toloka——众包平台；社交媒体上的网络众包计划； Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的，同时我们使用简单的神经网络纠正了标签错误。

数据集包含 20 个类，包括T 恤（1011 件），长袖（699 件），裤子（692 件），鞋子（431 件）衬衫（378 件），连衣裙（357 件），外套（312 件），短裤（308 件），帽子（171 件），裙子（155 件），西装外套（109 件）等。

商标数据集

数据集下载地址：http://m6z.cn/6cb2HG

在这项工作中，我们构建了一个大规模的 logo 数据集 Logo-2K+，它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像，具有 10 个根类别和 2,341 个类别。

Office-Home数据集

数据集下载地址：http://m6z.cn/5I6cFG

Office-Home 是一个用于域适应的基准数据集，它包含 4 个域，每个域由 65 个类别组成。这四个领域是：艺术——素描、绘画、装饰等形式的艺术形象；剪贴画——剪贴画图像的集合；产品——没有背景的物体图像；和真实世界——用普通相机拍摄的物体图像。它包含 15,500 张图像，平均每个类大约 70 张图像，一个类最多 99 张图像。

食物图像数据集

数据集下载地址：http://m6z.cn/6rdsSw

该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集，该数据包括图像的大规模缩小版本，以实现快速测试。数据已被重新格式化为 HDF5，特别是 Keras HDF5Matrix，这样可以轻松读取它们。文件名表示文件的内容。例如

foodc101n1000_r384x384x3.h5 表示有 101 个类别，n=1000 图像，分辨率为 384x384x3（RGB，uint8）
foodtestc101n1000r32x32x1.h5 表示数据是验证集的一部分，代表 101 个类别，n=1000 图像，分辨率为 32x32x1（float32 从 -1 到 1）

使用该数据集的第一个目标是对未知图像进行分类，但除此之外，还可以查看哪些区域/图像组件对进行分类很重要，将新类型的食物识别为现有标签的组合，构建对象检测器，可以在整个场景中找到相似的对象。

图像分类相关优质开源数据集汇总（附下载链接）