YOLOV5:数据集制作【照着做你也能训练自己的神经网络】

YOLOV5:数据集制作

总体流程:
labellmg标记(.xml)-> split.py (生成四个集的txt)-> txt2yolo.py -> 各个图像的txt -> 按照标准规范文件夹 -> 制作yaml文件

请添加图片描述

(这里注意,要把照片全部换成jpg格式,通过函数转换,而且照片名字中不能带中文)

第一步:使用labellmg进行标记

请添加图片描述

快捷键:请添加图片描述

在汇总的时候要检测是不是一张照片对应一张标签:
这里可以设置为中图标,一个照片一个标签,看哪里出问题了。
请添加图片描述

第二步:用split.py在新文件中生成四个txt,同时在四个txt中分配好了哪些图片是训练集哪些是验证集

请添加图片描述

split.py文件配置

请添加图片描述

--xml
C:\Users\zhaohaobing\PycharmProjects\python-yolov5-project\Data_set_processing\imagesplus
--txt
C:\Users\zhaohaobing\PycharmProjects\python-yolov5-project\Data_set_processing\imagespluss

第三步:xml2yolo.py

请添加图片描述

请添加图片描述

请添加图片描述

这里会报的错:
是照片和标签名字中有中文!!!
请添加图片描述
解决办法:
第一种:
根据报错的文件名字去.xml和.jpg文件夹搜
请添加图片描述

第二种:
在生成的图片标签txt文件的文件夹种看卡在哪个文件了,再回去找.xml文件中
请添加图片描述

第四步:random1.py

随机将照片和标签分配到train和valid中

注意,这里不能命名random,因为python中有random函数,pycharm分不清是调函数还是调程序
请添加图片描述

第五步:标准化数据集文件夹格式

请添加图片描述

第六步:制作配置文件 data.yaml

请添加图片描述
请添加图片描述

配置文件里要写:数据都去哪读,nc类别数目
train: ../train/images
val: ../valid/images

nc: 2
names: ['锡纸', '塑料']

猜你喜欢

转载自blog.csdn.net/zhaohaobingniu/article/details/120397185
今日推荐