《TensorFlow:实战Google深度学习框架》——6.1 图像识别中经典数据集介绍

1、CIFAR数据集

CIFAR是一个影响力很大的图像分类数据集,CIFAR数据集中的图片为32*32的彩色图片,由Alex  Krizhevsky教授、Vinod Nair博士和Geoffrey Hinton教授整理的。

CIFAR是图像词典项目(Visual Dictionary)中800万张图片的一个子集。CIFAR数据集分为CIFAR-10CIFAR-100两个问题。

CIFAR-10问题收集了10个不同种类的60000张图片,每张图片仅包含一个种类的实体,每个类有6000个图像。有50000个训练图像和10000个测试图像。训练图像分为5个训练批次,每个批次包含100000万图像。下图显示了CIFAR-10数据集中的每一个种类的一些样例图片以及这些种类的类别名称。CIFAR官网https: //www.cs.toronto.edu/~kriz/cifar.html提供不同格式的CIFAR数据集下载。
 

CIFAR-100收集了100个类,每个类包含600个图像。每类各有500个训练图像和100个测试图像。CIFAR-100中的100个类被分成20个超类。每个图像都有一个所属类的名称所属超类的名称


2、ImageNet数据集

ImageNet数据集是由斯坦福大学李飞飞教授带头整理的数据集。

ImageNet是基于WordNet的大型图像数据库。将近1500万图片被关联到了WordNet的大约20000个名词同义词集上。每一个与ImageNet相关的WordNet同义词集都代表了现实世界中的一个实体,是分类问题中的一个类别。ImageNet中的图片是从互联网上爬取下来的,并且通过亚马逊的人工标注服务将图片分类到WordNet的同义词集上。

ImageNet的每一个图片可能会包含多个实体,这是和CIFAR数据集的区别,下图展示了ImageNet中的一张图片,图片中用几个矩形框出了不同实体的轮廓,在图像识别问题中,一般将用于框出实体的矩形成为bounding box。

ImageNet2012目前是使用比较多的数据集,包含了1000个类别的120万张图片,每张图片只属于一个类别

猜你喜欢

转载自blog.csdn.net/Sophia_11/article/details/84503467