【水下目标检测】比赛记录和心得 day4

改进成果:

  1. 果然新训练的有了些许提升(提高了 5%),然后应该再训练一会可以更好地收敛(由于硬件原因只训练了大概 5、6 个 epoch,晚上睡觉再训练吧,,,);
  2. 昨天的合成样本考虑了简单的方法,即先将图片分成困难分类(im_hard)和简单分类(im_easy),分完之后大概是 43 : 45 43:45 的比率,那么合成样本就是 i m = 0.75 i m h a r d + 0.25 i m e a s y im^{'}=0.75*im_{hard}+0.25*im_{easy} ,这样训练的结果对于海星海胆这样比较清晰的目标结果比较好,但是由于海参、贝壳(因为大部分贝壳都埋在土里)本来就难以区分,导致结果不是很好;

正在做的工作:

群里有人说去年 YOLO v3 的成绩不错,并且我还发现它的一个版本的源码不需要编译 Cython 文件,所以租了一个 2080Ti 的服务器,跑了 60 个 epoch,结果如图:
在这里插入图片描述
在这里插入图片描述

这里训练的没有怎么调参数,也没有用太多的 tricks,所以结果似乎不尽如人意,召回率为 0.97 左右,准确率只有 0.03 左右(但不得不说这个源码做的标注是真滴好看);

所以下一步会在这个 YOLO v3 的基础上改一下代码并使用一些 tricks,看看效果如何:

  1. 先在分布均衡的样本上训练;
  2. 加上 nms;
  3. 进行更精细的样本合成;
  4. 修改一下 Loss 函数,使用 Focal Loss 或者其他的优化函数;
  5. 使用 random shape 进行多尺度训练;
  6. 看一下 OHEM(在线难例挖掘);
  7. 关心一下 IOU 值(之前 0.5 好像有点小);

闲言碎语:

到这里我还是不想放弃 Faster-RCNN + MobileNet V2 的思路,但是由于在租用的服务器上编译它的 Cython 文件总是出各种问题,遂先暂时把重心放到 YOLO V3 上吧,,,

加上最近也在看 EEG(脑电图识别)的论文,可能时间不是很充裕,就随天意吧,毕竟炼丹
嘛hahhh;

发布了100 篇原创文章 · 获赞 142 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_44936889/article/details/104657074