基于SSD与YOLOv5的小目标检测算法分析,转自《中国信息科技》

本文转自《中国信息科技》,为学习记录,方便查阅

基于SSD与YOLOv5的小目标检测算法分析

周文, 苟艳,陈郎郎 ,施天,袁子粟

南京财经大学信息工程学院   江苏南京  210023

摘  要:SSD是单阶段的目标检测算法,通过卷积神经网络进行特征提取,取不同的特征层进行检测输出,所以SSD是一种多尺度的检测方法。在需要检测的特征层,直接使用一个3*3卷积,进行通道的变换。SSD采用了anchor的策略,预设不同长宽比例的anchor,每一个输出特征层基于anchor预测多个检测框(4或者6)。采用了多尺度检测方法,在浅层用于检测小目标。深层用于检测大目标。YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。我们进行SSD与YOLOv5的算法实验,对实验进行分析获取小目标算法较好的改进思路。

关键词: SSD;YOLOv5;目标检测算法

1  引言

SSD与YOLOv5算法均为目标检测算法中的一阶段算法,小目标检测是近年来的计算机视觉中的难点和痛点,因为小目标相比于大目标在样本中不容易发现,分辨率低、特征少、样本不均衡等问题。近年来,许多研究者基于现有的目标检测算法进行改进应用于小目标检测,为了更加有效地改进小目标检测的算法和现实应用的需求,本文从一阶段目标检测算法中选择了YOLOv5与SSD进行实验,对实验结果和过程进行分析,得出改进小目标检测算法的建议。

研究主题旨在通过实验对两种模型进行评估,通过实验不仅处理两种模型的评价,小组进行讨论和总结从中来寻找到小目标检测算法的改进策略。

2  数据集介绍

本实验基于VOC和COCO数据集上进行。

2.1  VOC

Pascal VOC challenge是一个非常流行的数据集,用于构建和评估用于图像分类、对象检测和分割的算法。

作为标准数据集,voc-2007是衡量图像分类识别能力的基准。VOC数据集共包含:训练集(5011幅),测试集(4952幅),共计9963幅图,共包含20个种类。(bicycle bird boat bottle bus car cat chair cow …… )。VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。Faster-rcnn,YOLO都以此数据集作为演示样例。

2.2  COCO

COCO的全称是Common Objects in COntext,是微软团队提供的一个可以用来进行图像识别的数据集。MS COCO数据集中的图像分为训练、验证和测试集。COCO通过在Flickr上搜索80个对象类别和各种场景类型来收集图像,其使用了亚马逊的Mechanical Turk(AMT)。

COCO数据集是微软团队获取的一个可以用来图像recognition+segmentation+captioning 数据集,该数据集主要有的特点如下:(1)Object segmentation(2)Recognition in Context(3)Multiple objects per image(4)More than 300,000 images(5)More than 2 Million instances(6)80 object categories(7)5 captions per image(8)Keypoints on 100,000 people

该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。

3  模型实验结果和分析

我们首先在在进行了YOLOV5算法实验,共训练了29轮,每轮训练批数量为50。YOLOv5算法实验结果如图1。

图1 YOLOv5算法实验结果

由于设备原因,SSD算法在VOC上进行了实验,实验过程中,训练轮次30轮次,每轮次训练最大批量数为50,其中部分实验结果如图2。

图2 SSD算法实验结果

4  结论

本次实验的目的是在已有的目标检测算法中通过实验寻求到小目标检测算法的改进方向和研究方向,选择mAP作为评价指标来看,虽然YOLOv5和SSD1取得了不错的效果,但他们针对于小目标检测而言,针对性较弱,小目标检测在本次实验中我们发现一下缺陷:

  1. 小目标物体在图像中针对于图像而言,目标较小,不利于定位和识别。
  2. 深度神经网络需要大量的数据去训练,而现有的数据集,关于小目标物体的图像数量比较少,不利于训练出能够广泛应用的小目标检测识别器。
  3. 小目标物体周围如果存在缺陷或者干扰类别则小目标识别分类器的检测难度增大,甚至会造成识别错误等问题。
  4. 小目标标注需要大量的人工成本,现有的目标检测模型都是强监督的算法检测模型。
  5. 小目标物体的图像分辨率比较低,导致小目标算法检测器识别和定位都比较困难。
  6. 部分小目标物体极小,现有的深度学习和未来的深度学习网络都无法去解决,需要使用其他知识来弥补这一缺失。

参考文献

[1]李红光, 于若男, 丁文锐. 基于深度学习的小目标检测研究进展[J]. 航空学报, 2021, 42(7):19.Mousa R. yolov4.  2021.

[2]唐聪, 凌永顺, 郑科栋,等. 基于深度学习的多视窗SSD目标检测方法[J]. 红外与激光工程, 2018, 47(1):9.

[3]李红艳, 吴成柯. 一种基于小波与遗传算法的小目标检测算法[J]. 电子学报, 2001, 29(004):439-442.

[4]Jiaji Z ,  Zhengyuan T , Jie Y , et al. Infrared small target detection based on image sparse representation基于图像稀疏表示的红外小目标检测算法. 2011.

[5]Liu W, Anguelov D, Erhan D, et al. Ssd: Single shot multibox detector[C]//European conference on computer vision. Springer, Cham, 2016: 21-37.

[6]陈科圻, 朱志亮, 邓小明, 马翠霞,王宏安(2020). 多尺度目标检测的深度学习研究综述. 软件学报, 32(4), 1201-1227.

猜你喜欢

转载自blog.csdn.net/ZHUO__zhuo/article/details/130459560