目录
一 前言
对于图像数据集的获取,一直是一个麻烦点,自己不想去标注数据,太繁琐了,所以,我分享出一个可以筛选数据集的方法,也算个自己以后做个备忘,防止以后忘记咯
二 数据平台
两个平台,也是看其他人的博客获取到的
PASCALhttp://host.robots.ox.ac.uk/pascal/VOC/
COCOhttps://cocodataset.org/#home
三 数据处理
我这里使用 PASVAL获取的数据集 作为一个参照,平台的话使用的是 MaixHub 在线训练平台
1. MaixHub平台使用
看图使用,注册好平台账号以后,直接点击开始训练模型
看图使用,点击新建训练,自己个自己的项目取个名字
看图,我们点击新建的项目之后,点击数据集的选项
看图,点击创建数据集,名字还是自己取一个
创建好了,点击查看,给我们的数据集添加数据
看图,先选择导入数据,然后点击选择压缩包
2. ZIP格式整理与上传平台
我们下载下来的格式如下,我们需要用到我框中的数据,然后新建一个文件夹,去存放数据,格式如下
整理好了格式就如下,我们添加压缩包然后再返回平台 ,选择我们的压缩包就行了,平台会主动识别和标注,最后上传就行。
3. 数据处理(使用平台删除标注)
这里有20个类别,保留我们需要的识别标注就行
这里我只留了 瓶子的标注数据
看图,我们可以直接到处这个100个瓶子标注数据
直接批量删除没有标记的图片
导出之后的目录,也就是100个数据
四 参考
人脸检测和人体检测https://blog.csdn.net/guyuealian/article/details/128821763
END