1. 前言
项目需要用目标检测模型,由于yolov3精度和性能突出,成为最后选择的模型。但是因为在实际场景中会有误检测和漏检测的情况,还需要采集实际场景的数据进行微调。思路是直接调整由ImageNet+coco数据集训练出来的权重yolov3.weights,冻结前面的层数,只微调后面n层。
系统:Ubuntu 18.04
2. 过程
2.1. 数据准备
采集好图片,筛选,标注,转换。
其中标注工具我们使用的是labelImg,可以搜索安装。但是一般标注的时候选的是PascalVoc格式,最后保存的是xml文件,而yolov3的模型需要读取yolo格式的标签文件,因此需要手动转换,可参考voc_label.py。
然后是各种配置文件,参考:建立自己的YOLO辨識模型 – 以柑橘辨識為例
包括根据种类调整网络结构等,注意因为是fine tune,需要将LR调整低一点,我是直接调为原来的1/2,后面如果不太好再继续调整。
2.2. 提取冻结层
主要是为了冻结已经训练好的网络中的前n层的权重,命令:
# 冻结前81层 darknet partial cfg/yolov3.cfg yolov3.weights yolov3.conv.81 81
这个时候会在本路径提取出名为yolov3.conv.81的预训练模型。
2.3. 训练
命令:
# 使用多gpu进行训练 darknet detector train cfg/coco.data cfg/yolov3.cfg yolov3.conv.81 -gpus 0,1
3. 参考
(完)