PASCAL VOC数据集

PASCAL VOC数据集可用于训练评估图像分类、目标检测和分割算法。
本文章就此数据集中与yolo算法相关的部分进行讲解。

可从此下载Pascal VOC Dataset，此数据集包含5个文件夹，其文件目录如下所示：

   .
    └── VOCdevkit     #根目录
        └── VOC2007 / 2012         #不同年份的数据集
	        ├── JPEGImages         #存放源图片
            ├── Annotations        #存放xml文件，与JPEGImages中的图片一一对应，解释图片的内容等等
            ├── ImageSets          #该目录下存放的都是txt文件，txt文件中每一行包含一个图片的名称，末尾会加上±1表示正负样本
            │   ├── Action
            │   ├── Layout
            │   ├── Main
            │   └── Segmentation        
            ├── SegmentationClass  #存放的是图片，分割后的效果
            └── SegmentationObject #存放的是图片，分割后的效果

1、JPEGImages

此文件夹下包含了PASCAL VOC数据集下的所有图片
在这里插入图片描述
2、Annotations

此文件夹下存放的是xml文件，每个文件都与JPEGImages中的一张图片相对应。

xml文件中的内容如下：

<annotation>
	<folder>VOC2007</folder>                                    # 数据集
	<filename>000019.jpg</filename>                             # 图像名
	<source>                                                    # 图像来源
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation>
		<image>flickr</image>
		<flickrid>330638158</flickrid>
	</source>
	<owner>
		<flickrid>Rosenberg1/ Simmo</flickrid>
		<name>?</name>
	</owner>
	<size>													   # 图像尺寸
		<width>500</width>
		<height>375</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>                                   # 是否可用于图像分割算法
	<object>                                                   # 一个目标
		<name>cat</name>                                       # 目标的类别
		<pose>Right</pose>                                     # 拍摄角度
		<truncated>0</truncated>                               # 目标是否被截断
		<difficult>0</difficult>                               # 目标是否容易识别
		<bndbox>                                               # bounding box左上角和右下角的坐标
			<xmin>231</xmin>
			<ymin>88</ymin>
			<xmax>483</xmax>
			<ymax>256</ymax>
		</bndbox>
	</object>
	<object>                                                   # 另一个目标
		<name>cat</name>
		<pose>Right</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>11</xmin>
			<ymin>113</ymin>
			<xmax>266</xmax>
			<ymax>259</ymax>
		</bndbox>
	</object>
</annotation>

对应的图片为：
在这里插入图片描述

3、ImageSets

ImageSets下有四个文件夹，Main文件夹下保存的是与yolo目标检测相关的数据。
trainval.txt 中保存的是图像名
在这里插入图片描述

4、SegmentationClass

在这里插入图片描述

5、SegmentationObject
在这里插入图片描述

猜你喜欢