版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/baidu_27643275/article/details/82754902
PASCAL VOC数据集可用于训练评估 图像分类、目标检测和分割算法。
本文章就此数据集中与yolo算法相关的部分进行讲解。
可从此下载Pascal VOC Dataset,此数据集包含5个文件夹,其文件目录如下所示:
.
└── VOCdevkit #根目录
└── VOC2007 / 2012 #不同年份的数据集
├── JPEGImages #存放源图片
├── Annotations #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
├── ImageSets #该目录下存放的都是txt文件,txt文件中每一行包含一个图片的名称,末尾会加上±1表示正负样本
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── SegmentationClass #存放的是图片,分割后的效果
└── SegmentationObject #存放的是图片,分割后的效果
1、JPEGImages
此文件夹下包含了PASCAL VOC数据集下的所有图片
2、Annotations
此文件夹下存放的是xml文件,每个文件都与JPEGImages中的一张图片相对应。
xml文件中的内容如下:
<annotation>
<folder>VOC2007</folder> # 数据集
<filename>000019.jpg</filename> # 图像名
<source> # 图像来源
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
<flickrid>330638158</flickrid>
</source>
<owner>
<flickrid>Rosenberg1/ Simmo</flickrid>
<name>?</name>
</owner>
<size> # 图像尺寸
<width>500</width>
<height>375</height>
<depth>3</depth>
</size>
<segmented>0</segmented> # 是否可用于图像分割算法
<object> # 一个目标
<name>cat</name> # 目标的类别
<pose>Right</pose> # 拍摄角度
<truncated>0</truncated> # 目标是否被截断
<difficult>0</difficult> # 目标是否容易识别
<bndbox> # bounding box左上角和右下角的坐标
<xmin>231</xmin>
<ymin>88</ymin>
<xmax>483</xmax>
<ymax>256</ymax>
</bndbox>
</object>
<object> # 另一个目标
<name>cat</name>
<pose>Right</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>11</xmin>
<ymin>113</ymin>
<xmax>266</xmax>
<ymax>259</ymax>
</bndbox>
</object>
</annotation>
对应的图片为:
3、ImageSets
ImageSets下有四个文件夹,Main文件夹下保存的是与yolo目标检测相关的数据。
trainval.txt 中保存的是图像名
4、SegmentationClass
5、SegmentationObject