提到手持场景,这里很容易就会跟安全挂钩,在之前的一些项目中,有做过持刀检测相关的实践,在我前面的博文中也有做过安全相关的检测识别类的项目,本文主要是立足于手持场景,但是却不仅限于持刀、持枪的检测识别,很多其他的类型的目标在我之前的项目中都被误识别为了刀枪,这里是我们不愿意看到的事情,所以这里将手持物品作为一个单独的场景进行了相关模型的开发,话不多说简单看下效果:
这里一共定义了六种手持物品,如下:
卡片
智能手机
手枪
钱包
钞票
刀
简单看下数据集:
VOC格式数据标注文件如下:
实例标注内容如下:
<annotation>
<folder>images</folder>
<filename>0b9fe9cc-3682-4f6d-a72e-b0db0d0cd42b.jpg</filename>
<path>0b9fe9cc-3682-4f6d-a72e-b0db0d0cd42b.jpg</path>
<source>
<database>Unknown</database>
</source>
<size>
<width>1920</width>
<height>1090</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>knife</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>1070</xmin>
<ymin>608</ymin>
<xmax>1192</xmax>
<ymax>726</ymax>
</bndbox>
</object>
</annotation>
YOLO格式数据标注文件如下:
扫描二维码关注公众号,回复:
15244063 查看本文章
实例标注内容如下:
5 0.475781 0.880556 0.140625 0.091667
同样:
这里是基于yolov5s系列模型开发构建的,图像尺寸指定的是416x416尺寸的,默认会执行100次epoch的迭代计算。
简单看下结果:
【F1值曲线】
【精确率曲线】
【召回率曲线】
【PR曲线】
【训练可视化】
【batch实例】
【混淆矩阵】
更多详情共建共创。
简单看下实例推理效果:
还是蛮不错的。