yolo-开源数据集coco kitti voc

1、kitti数据集(参考博客:https://blog.csdn.net/jesse_mx/article/details/65634482  https://blog.csdn.net/baolinq/article/details/78939192)
(1)下载数据集和标签,下载第1个图片集 Download left color images of object data set (12 GB)和标注文件 Download training labels of object data set (5 MB)
(2)转化成VOC格式的数据集:
     a:新建文件夹Annotation(存放xml文件)、ImageSets(存放一个Main文件夹用来存放各类的train.txt test.txt val.txt)和JPEGImages(存放所有带有标签的图片)。
     b:类别转化,使用参考修改后的工具modify_annotations_txt.py, 修改原始kitti标签 ,使得labels中的txt文件只包含我们需要的类别(注意该步会直接修改labels中的标签,请做好备份)。
     c:将转换后labels下的txt标注信息转化成xml格式,并存储在Annotation文件夹下面,使用工具文件txt_to_xml.py。
     d:生成训练\验证\测试集列表(生成比例可修改,目前按8:1:1生成),使用工具create_train_test_txt.py,文件保存在ImageSets文件夹Main下。
     e:根据Annotation,使用工具create_kitti_label.py生成最终的labels文件夹和训练、测试列表(先删除b步下的labels文件夹)

2、VOCdevkit数据集(VOC2007、VOC2012)
参考脚本:create_voc_label.py 即可

3、coco数据集制作
参考脚本:create_coco_label.py 即可

以上脚本见github:

猜你喜欢

转载自www.cnblogs.com/llfctt/p/9039166.html