王权富贵:VOC2007数据集格式详解和下载

VOC2012和VOC2007的下载地址:

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

​​​​​​​

  • Annotations文件夹 
    • 该文件下存放的是xml格式的标签文件,每个xml文件都对应于JPEGImages文件夹的一张图片。
    • 这是最重要的,保存重要的位置信息
    • size 是图片的信息
    • object 是物体名称信息
      • bndbox 是物体Xmin,Ymin,Xmin,Ymax的信息
    • <annotation>
          <folder>VOC2007</folder>
          <filename>000001.jpg</filename>
          <source>
              <database>My Database</database>
              <annotation>VOC2007</annotation>
              <image>flickr</image>
              <flickrid>NULL</flickrid>
          </source>
          <owner>
              <flickrid>NULL</flickrid>
              <name>QQ974573656</name>
          </owner>
          <size>
              <width>500</width>
              <height>375</height>
              <depth>3</depth>
          </size>
          <segmented>0</segmented>
          <object>
              <name>person</name>
              <pose>Unspecified</pose>
              <truncated>0</truncated>
              <difficult>0</difficult>
              <bndbox>
                  <xmin>213</xmin>
                  <ymin>155</ymin>
                  <xmax>283</xmax>
                  <ymax>374</ymax>
              </bndbox>
          </object>
      </annotation>
      
  • JPEGImages文件夹
    • 改文件夹下存放的是数据集图片,包括训练和测试图片。
    • 以上两个是最重要的信息
  • ImageSets文件夹
    • 该文件夹下存放了三个文件,分别是Layout、Main、Segmentation。在这里我们只用存放图像数据的Main文件,其他两个暂且不管。
    • 主要是main文件夹中的信息
        • 这里train_test.txt放着的是要训练的图片文件名
        • test.txt放着的是测试的的图片文件名
        • 物品名_test.txt这边用来计算识别的准确率。(1表示有,0表示不好识别,-1表示没有)
  • SegmentationClass文件和SegmentationObject文件。
    • 这两个文件都是与图像分割相关
    • 对目标检测没有什么用处

猜你喜欢

转载自blog.csdn.net/a1103688841/article/details/84345238