对YOLOv3进行瘦身-行人检测

其他 2020-03-31 10:58:33 阅读次数: 0

0 前言

前面用RFSong实现了GPU 200 FPS，并且测试结果发现在COCO上也只比YOLOv3低了六七个点左右，基本可以满足自己的使用需求了。因此下面想试试YOLO按照RFSong进行改进，看看能不能在精度只掉一点的情况下，实现更快的速度。

1. 确定基线

尝试对YOLO在VOC COCO的行人图片数据集进行从头训练，也就是不加载任何权重直接进行目标检测任务的训练（这里没有开启多尺度训练，因为太耗时了等最后再加）。不过说是从头训其实也没有完全从头训，因为感觉前面YOLO的设计还是比较给力的，削减channel和层数的空间不大，因此这里就加载了前面部分的参数（这里加载了前面25层）：

只要对下面的代码进行修改即可：

最终在COCO2017 val上得到行人检测的AP大概在0.68

不过当利用YOLOv3 COCO预训练模型的时候，测试精度可以达到72,7的AP。

2. 对YOLO进行瘦身

原来的YOLO还是比较庞大的，但是如果只检测行人这一个类，其实削减一些参数精度也下降不会太多。这里我就试试将后面那两个8个模块堆叠的部分削薄了，都改成了4,。还有后面的一些chanel是1024，我这里最多就使用512。总的来说就是：

1. 削减一些层

2. 削减channel数目

3. 删去瓶颈层的大部分的relu。也就是前面channel多，经过这个卷积后，channel变少了，对于这的卷积后面就不加relu了。(参考mobilenetV2)

可以看到模型的参数量有了非常显著的下降：由原来的61.9 M变成了现在的21.2 M

最终的mAP也只差1.4个百分点，速度快了一倍（这里开启了多尺度）

速度对比：

GPU对比：

原始的YOLO v3速度测试，原来大概是40FPS的样子：

经过自己大致裁剪的YOLO模型的速度达到了59 FPS

CPU对比：

原版YOLO CPU速度，去掉前面5张取平均为0.91 s

瘦身后的YOLOv3: 0.57 s

3. 加载COCO浅层权重进行训练

由于前面很多层其实也没做改动，因此其实完全可以加载部分参数。如果加载YOLOv3 COCO权重的前面25层（也就是前面没有改动的层）进行实验看看效果。代码发现人家已经实现了，这里只需要计算出加载的层就行：

发现前面多吃尺度训练还是很耗时，关掉后测得mAP为65.5，差了一个多点，其实可能就是多尺度造成的吧。使用YOLO v3 COCO权重发现比darknet53收敛快了不少，所以还是推荐用COCO训练的权重：

4. 增加SYSY数据集

最后一个epoch达到了69.2的AP，这比原来的YOLO还高了啊，可以啊。当然很有可能是YOLOv3从头训没有训好的原因

然后利用这个模型在只用COCO行人的数据集进行finetune几个epoch再去测试，最终达到了70的AP。

交流请加群云深不知处-目标检测 763679865

松菇

发布了16 篇原创文章 · 获赞 37 · 访问量 8464

私信关注

猜你喜欢

转载自blog.csdn.net/songwsx/article/details/102715082

对YOLOv3进行瘦身-行人检测

YOLOV3—进行车辆检测

基于yolov3的行人目标检测算法在图像和视频中识别检测

opencv调用YOLOv3模型进行目标检测

YOLOv3使用Python接口进行视频目标检测

基于YOLOv3和Qt5的车辆行人检测（C++版本）

YoloV3目标检测

目标检测：YOLOV3

【目标检测】【代码阅读】ubuntu16.04利用yolov3进行红绿灯检测

目标检测：YOLOV3论文解读

目标检测网络之 YOLOv3

目标检测之YOLOv3

yolov3物体检测

理解YOLOv3——分析检测代码

目标检测——YOLOV3的学习笔记

目标检测——YOLOv3（六）

【目标检测】YOLOV3详解

目标检测学习--yolov3

C++应用中调用YOLOv3（darknet）进行目标检测

实现自定义目标检测：使用 YOLOv3 进行图像识别和定位

OpenCV (一）yoloV3 / yoloV4 对象检测

目标检测-yolov3实现人脸检测

科技提升安全，基于YOLOv3开发构建商超扶梯场景下行人安全行为姿态检测识别系统

YOLOv3和OpenCV3.4.2进行基于深度学习的目标检测 vs2015运行

Matlab实现YOLOV3对车辆进行检测--全程中文说明适合初学者学习

yolov5眨眼检测 yolov3眨眼识别睁眼检测闭眼检测

YOLOv3使用笔记——保存检测视频结果

基于caffe框架复现yolov3目标检测

yolov3算法检测单类物体

darknet yoloV3 摄像头检测不到

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)