(六)华为ModelArts 半自动标注 锥桶数据集yolov5s 打标签不用这么辛苦啦

  1. 预备知识

深度学习中,有时候需要完成特定任务需要自制数据集,达到训练效果,以目标检测为例,任务就是在一张图片中画出一个框,框内为我们感兴趣的物体,yolov5s自带的模型结果如下:

假设我们的任务是检测锥桶,数据集是图片,我们希望将红色、蓝色、黄色锥桶检测出来,其实是大学生方程式赛车任务,效果如下:

通常我们需要自己打标签,这里用到工具是labelimg

1.1 安装anaconda,配置pyroch环境

这个和之前agx配置环境一样的,甚至简单许多,这里不再赘述。

1.2 安装labelimg

conda install labelimg

1.3 运行labelimg

在虚拟环境内打开,命令行直接输入

labelimg
  1. 选择输入、输出文件位置;

  1. 选择标签格式,常用的三种格式都有,也有很多代码,可以格式相互转换不用担心

  1. 点击creat rectbox 输入标签

  1. 保存后会在设置的路径自动输出

  1. 快捷键:W画框,D下一张

输出的标签,txt或者yaml,txt是yolo格式 第一列代表类别,后边四列是归一化的中心的和长款。yaml是Pascal,不同的是保存绝对位置,但是对于一张图片来说,都存储的目标的位置。

  1. ModelArts 智能标注

假设我们有200张图片,每个图片上有20个锥桶,一个锥桶5s,也要五多个小时。实际操作过都知道根本不可能完成的,而且200张图片的数据集也是很少的。因此探寻一种更高效的方法:半监督标注。网上有很多开源代码,但是都要配环境,重复实验,这里采用华为ModelArts 智能标注功能,目前是限时免费!https://console.huaweicloud.com/modelarts

2.1 控制台

首先进入控制台,进入modelarts页面,数据管理。(当然你需要自己先注册个华为账号,万一以后投简历说不定也用得到)

2.2 创建数据集

这里需要华为的obs路径,这个不是免费的,但是费用也不贵,类似于百度网盘,按需收费,可以先开通,充个两三块钱的样子,一天大概几毛钱(数据量不太的情况下,一两个G)。

因为自己以前就有,就没有重复创建了,下载obs browser速度应该更快一点,不过网页版本应该也可以。先将自己的数据上传到 obs 桶中。

还记得刚才的标签格式吗,这里也要保持一致,可以点击图中标注文件格式说明具体查看,我这里采用的是pascal,上传到数据集之前自己已经标了15张,后边解释。

2.3 智能标注

选择物体检测,数据集选择刚才的数据集,点击智能标注。可以看到这时候提示不少于5个样本,所以最开始需要我们手动标记一些,如果你确定已经上传好标签,只用耐心等一会儿,看到已经标签为15就可以开始了,选择精准型

由于现在是8*v100,所以200多张的数据集他训练的很快,大概十分钟左右就完成了,可以看到有很多待确认的,可以看到第一遍还是有很多错误的,漏标,误检。这个页面类似于网页版本的labelimg,你可以修改结果,然后保存。

修改了几十张后(不需要都确认),就开始第二轮智能标注。可以明显感觉,第二次的准确的度都大幅度上升,然后再一次从待确认中确认部分图片。

2.4 发布数据

最后点击发布,东西就会存到了obs中,可以从obs中下载,然后去训练模型什么的,可以返回到本地labelimg看一下,当然这些都是手动确认后的结果,所以看起来还不错,也不知道是自己修改的多,还是他标记的多。

2.5 总结

  1. 虽然不是完全的自动化,但是半自动化标注其实到第二轮第三轮已经不错了,假如数据量很大,同时有手动标记了20%左右,可能效果就比较好。自己仅仅是实验尝试用的,所以才标记了15/200,就能有个说的过去的效果,还算可以。

  1. 目前网页还是有点点卡顿,要是能更流畅一点。不过限时免费,算上obs一天两毛钱,你就可以用上195一个小时的八张V100帮你打标签,真香,不知道服务什么取消。虽然之前觉得modelarts不好用,但是现在好多功能挺厉害的(但是有的需要收费)。

  1. 目前还有很多不懂的地方,比如这个其实数据集222张,但是很多是没有目标的,这些应该怎么导出空文件之类的还不是很懂。另外其实obs的日志还有很多东西,有看起来像是权重文件的,这个是不是就是自动学习了,不知道这个能不能利用。

  1. 后期打算把标签文件用作yolov5s的训练集,测试一下,看看能不能训练成功(虽然有点空手套白狼的感觉)虽然和agx,没啥关系,但是还是放在这个专题下了。

  1. 要是哪里可以有GPU羊毛可以薅的,会继续关注下。

猜你喜欢

转载自blog.csdn.net/qq_53086461/article/details/129210323
今日推荐