1. 数据集概述
在建立自己的数据集之前,需要对常用的公开数据集进行了解,以统一格式和标准,也可以对分块处理等想法的产生起到一定的思路帮助。
MNIST | ImageNet | PASCAL VOC | COCO | |
简介 | 手写数字数据库 | 图像分类、定位、检测 | 视觉对象的分类识别和检测 | Common Objects in Context,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述 |
官网 | http://yann.lecun.com/exdb/mnist/index.html | http://image-net.org/ | http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html | http://mscoco.org/ |
下载地址 | 见官网 | 见官网 | 见官网 | 见官网 |
样本总数 | 70000 | 14,197,122 | ||
训练样本总数 | 60000 | |||
测试样本总数 | 10000 | |||
样本大小(size) | 28*28 | 各式各样 | ||
数据集大小 | 12MB | about 1TB | about 40GB | |
标签类别 | 0~9数字 | 2万多个类别 | 20个 | 80个对象类别 |
存储格式 | 二进制 | |||
标签形式 | 二进制 | |||
标注格式 | 0~9 | |||
标注方法 | 对0~9数字进行标注 | 1)非空的同义词集总数:21841;2)图像总数:14,197,122;3)边界框注释的图像数:1,034,908;4)具有SIFT特征的同义词集数:1000;5)具有SIFT特征的图像数:120万 | 对象分割,bounding box;action | 1)对象分割; 2)上下文识别; 3)每个图像的多个对象; 4)超过300000幅图像; 5)超过200万个实例; 6)80个对象类别; 7)每个图像5个说明文字; 8)100000人的关键点 |
发起人 | Yann LeCun,1998 | Li Feifei,2006 | ||
目前状态 | 定型,不会更新了 | 持续更新中 | 停止更新 | 微软赞助,应该持续更新中 |
特点和评价 | 入门第一教程 | 对深度学习的浪潮起了巨大的推动作用 | 很标准,被很多人采用 | 对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述 |
用途 | 仅用于手写体识别,可以将此作为基础,进一步添加自己的数据 | 情景分析,看图说话;也可以仅用部分标签做识别和分类 | 目标分割,分类,识别 | 目标分割,分类,识别 |
ILSVRC,2010年起每年举办 | 因为核心人员去世,PASCAL VOC挑战赛在2012年后便不再举办,ECCV开始用ImageNet举办赛事,不知是否融合该数据集 |
因为最近用到语义分割所以对COCO数据集重点关注下。另因为做faster-rcnn,也对PASCAL VOC重点了解下。
2. COCO
官网也打不开我也是醉了。。。至于墙这个吗!
参考:
全面总结:https://www.jianshu.com/p/9990284bc4d5
COCO详细介绍:https://www.cnblogs.com/geekvc/p/6657369.html
各种简介:jianjie