改进成果:
- 果然新训练的有了些许提升(提高了 5%),然后应该再训练一会可以更好地收敛(由于硬件原因只训练了大概 5、6 个 epoch,晚上睡觉再训练吧,,,);
- 昨天的合成样本考虑了简单的方法,即先将图片分成困难分类(im_hard)和简单分类(im_easy),分完之后大概是 的比率,那么合成样本就是 ,这样训练的结果对于海星海胆这样比较清晰的目标结果比较好,但是由于海参、贝壳(因为大部分贝壳都埋在土里)本来就难以区分,导致结果不是很好;
正在做的工作:
群里有人说去年 YOLO v3 的成绩不错,并且我还发现它的一个版本的源码不需要编译 Cython 文件,所以租了一个 2080Ti 的服务器,跑了 60 个 epoch,结果如图:
这里训练的没有怎么调参数,也没有用太多的 tricks,所以结果似乎不尽如人意,召回率为 0.97 左右,准确率只有 0.03 左右(但不得不说这个源码做的标注是真滴好看);
所以下一步会在这个 YOLO v3 的基础上改一下代码并使用一些 tricks,看看效果如何:
- 先在分布均衡的样本上训练;
- 加上 nms;
- 进行更精细的样本合成;
- 修改一下 Loss 函数,使用 Focal Loss 或者其他的优化函数;
- 使用 random shape 进行多尺度训练;
- 看一下 OHEM(在线难例挖掘);
- 关心一下 IOU 值(之前 0.5 好像有点小);
闲言碎语:
到这里我还是不想放弃 Faster-RCNN + MobileNet V2 的思路,但是由于在租用的服务器上编译它的 Cython 文件总是出各种问题,遂先暂时把重心放到 YOLO V3 上吧,,,
加上最近也在看 EEG(脑电图识别)的论文,可能时间不是很充裕,就随天意吧,毕竟炼丹
嘛hahhh;