Microsoft COCO: Common Objects in Context笔记

MS COCO数据集分为三部分:介绍、数据集分类、展示

2014年版本(包含80个类的分割掩码)的数据:20G左右的图片和500M左右的标签       标签标记了每个segmentation的边界精确位置 + bounding box的精确目标,其精度均为小数点后两位。一个目标的annotation如下:

{"segmentation":[[392.87, 275.77, 402.24, 284.2, 382.54, 342.36, 375.99, 356.43, 372.23, 357.37, 372.23, 397.7, 383.48, 419.27,407.87, 439.91, 427.57, 389.25, 447.26, 346.11, 447.26, 328.29, 468.84, 290.77,472.59, 266.38], [429.44,465.23, 453.83, 473.67, 636.73, 474.61, 636.73, 392.07, 571.07, 364.88, 546.69,363.0]], "area": 28458.996150000003, "iscrowd": 0,"image_id": 503837, "bbox": [372.23, 266.38, 264.5,208.23], "category_id": 4, "id": 151109}, 

该数据集主要有的特点如下:(1)Object segmentation(2)Recognition in Context(3)Multiple objects per image(4)More than 300,000 images(5)More than 2 Million instances(6)80 object categories(7)5 captions per image(8)Keypoints on 100,000 people

微软在ECCV Workshops里发表的文章:Microsoft COCO: Common Objects in Context详细的介绍了这个数据集。这个数据集以scene understanding为目标,从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类(2015版)目标,328,000影像和2,500,000个label。

COCO数据集分两部分发布,前部分于2014年发布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775 testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。

猜你喜欢

转载自blog.csdn.net/yy2yy99/article/details/83577124