【DL (4)】公开数据集简介与比较

1. 数据集概述

在建立自己的数据集之前,需要对常用的公开数据集进行了解,以统一格式和标准,也可以对分块处理等想法的产生起到一定的思路帮助。

  MNIST ImageNet PASCAL VOC COCO
简介 手写数字数据库 图像分类、定位、检测 视觉对象的分类识别和检测 Common Objects in Context,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述
官网 http://yann.lecun.com/exdb/mnist/index.html http://image-net.org/ http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html http://mscoco.org/
下载地址 见官网 见官网 见官网 见官网
样本总数 70000 14,197,122    
训练样本总数 60000      
测试样本总数 10000      
样本大小(size) 28*28 各式各样    
数据集大小 12MB about 1TB   about 40GB
标签类别 0~9数字 2万多个类别 20个 80个对象类别
存储格式 二进制      
标签形式 二进制      
标注格式 0~9      
标注方法 对0~9数字进行标注 1)非空的同义词集总数:21841;2)图像总数:14,197,122;3)边界框注释的图像数:1,034,908;4)具有SIFT特征的同义词集数:1000;5)具有SIFT特征的图像数:120万 对象分割,bounding box;action 1)对象分割;  2)上下文识别;  3)每个图像的多个对象;  4)超过300000幅图像;  5)超过200万个实例; 6)80个对象类别; 7)每个图像5个说明文字; 8)100000人的关键点
发起人 Yann LeCun,1998 Li Feifei,2006    
目前状态 定型,不会更新了 持续更新中 停止更新 微软赞助,应该持续更新中
特点和评价 入门第一教程 对深度学习的浪潮起了巨大的推动作用 很标准,被很多人采用 对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述
用途 仅用于手写体识别,可以将此作为基础,进一步添加自己的数据 情景分析,看图说话;也可以仅用部分标签做识别和分类 目标分割,分类,识别 目标分割,分类,识别
    ILSVRC,2010年起每年举办 因为核心人员去世,PASCAL VOC挑战赛在2012年后便不再举办,ECCV开始用ImageNet举办赛事,不知是否融合该数据集  

因为最近用到语义分割所以对COCO数据集重点关注下。另因为做faster-rcnn,也对PASCAL VOC重点了解下。

2. COCO

官网也打不开我也是醉了。。。至于墙这个吗!

参考:

全面总结:https://www.jianshu.com/p/9990284bc4d5

COCO详细介绍:https://www.cnblogs.com/geekvc/p/6657369.html

各种简介:jianjie

猜你喜欢

转载自blog.csdn.net/foreverhehe716/article/details/81179301
DL