【DL (4)】公开数据集简介与比较

其他 2018-08-31 16:11:19 阅读次数: 0

1. 数据集概述

在建立自己的数据集之前，需要对常用的公开数据集进行了解，以统一格式和标准，也可以对分块处理等想法的产生起到一定的思路帮助。

	MNIST	ImageNet	PASCAL VOC	COCO
简介	手写数字数据库	图像分类、定位、检测	视觉对象的分类识别和检测	Common Objects in Context，其对于图像的标注信息不仅有类别、位置信息，还有对图像的语义文本描述
官网	http://yann.lecun.com/exdb/mnist/index.html	http://image-net.org/	http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html	http://mscoco.org/
下载地址	见官网	见官网	见官网	见官网
样本总数	70000	14,197,122
训练样本总数	60000
测试样本总数	10000
样本大小（size）	28*28	各式各样
数据集大小	12MB	about 1TB		about 40GB
标签类别	0~9数字	2万多个类别	20个	80个对象类别
存储格式	二进制
标签形式	二进制
标注格式	0~9
标注方法	对0~9数字进行标注	1）非空的同义词集总数：21841；2）图像总数：14,197,122；3）边界框注释的图像数：1,034,908；4）具有SIFT特征的同义词集数：1000；5）具有SIFT特征的图像数：120万	对象分割，bounding box；action	1）对象分割； 2）上下文识别； 3）每个图像的多个对象； 4）超过300000幅图像； 5）超过200万个实例； 6）80个对象类别； 7）每个图像5个说明文字； 8）100000人的关键点
发起人	Yann LeCun,1998	Li Feifei，2006
目前状态	定型，不会更新了	持续更新中	停止更新	微软赞助，应该持续更新中
特点和评价	入门第一教程	对深度学习的浪潮起了巨大的推动作用	很标准，被很多人采用	对于图像的标注信息不仅有类别、位置信息，还有对图像的语义文本描述
用途	仅用于手写体识别，可以将此作为基础，进一步添加自己的数据	情景分析，看图说话；也可以仅用部分标签做识别和分类	目标分割，分类，识别	目标分割，分类，识别
		ILSVRC，2010年起每年举办	因为核心人员去世，PASCAL VOC挑战赛在2012年后便不再举办，ECCV开始用ImageNet举办赛事，不知是否融合该数据集

因为最近用到语义分割所以对COCO数据集重点关注下。另因为做faster-rcnn，也对PASCAL VOC重点了解下。

2. COCO

官网也打不开我也是醉了。。。至于墙这个吗！

参考：

全面总结：https://www.jianshu.com/p/9990284bc4d5

COCO详细介绍：https://www.cnblogs.com/geekvc/p/6657369.html

各种简介：jianjie

猜你喜欢

转载自blog.csdn.net/foreverhehe716/article/details/81179301

【DL (4)】公开数据集简介与比较

【DL】深度学习简介

DL图像数据增广

dl & 大数据 INTVW

DL

DL 数据可视化

Dl4j - CSV数据转换

HTML标签dl dt dd用法简介

dl4j加载词向量

dl4j LSTM分类

DL4J--NeuralNetConfiguration类

dl4j实现yolo

【DL】第 4 章：自回归模型

【DL (6)】地理影像数据的detectron实现

HTML中dl、ul、ol用哪个比较好？

DL4J模型训练Word2Vec

整合DL4J训练模型与Web工程

HP proLiant DL360 G4

使用 DL4J 训练中文词向量

dl4j 报错加载词向量

【笔记】PyImageResearch-DL4CV阅读笔记-1

DL4J中文文档/模型/顶点

DL4J中文文档/模型/多层网络

DL4J中文文档/模型/卷积

DL4J中文文档/模型/计算图

DL4J中文文档/语言处理/Tokenization

DL4J中文文档/语言处理/SentenceIterator

DL4J中文文档/模型/迭代器

DL4J中文文档/语言处理/概述

DL4J中文文档/模型/层

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)