经典目标检测框架的要点总结

本篇写于18年暑假,后来转战跟踪就没怎么更新过,梳理了几个经典目标检测的点,以及他们的性能分数,本打算做毕设的时候梳理借鉴,没想到只能到这里了。

一.RCNN

  1. 选择性搜索
  2. Crop后分类(两种传入网络的方法,那种长宽都缩放到网络大小的比较好)
  3. SVM分类(FC的没有SVM的好,可能毕竟是没有训练吧)
  4. 速度:50s/img(慢)
  5. Bounding Box 回归

二.Fast-RCNN

扫描二维码关注公众号,回复: 5461768 查看本文章
  1. ROI(可BP
  2. 建议区还是选择性搜索
  3. 速度:0.32

 

三.Faster-RCNN

  1. RPN 位置建议网络,输出那一层,每个卷积核对应一种anchor(不同大小长宽比)的一种属性(置信分、x,y,h,w
  2. ROI这里补充说明,RPN回归的x,y是浮点数,需要取整数、再打格子
  3. 速度:0.2

四.RFCN

  1. 是双阶段的(还是有rpn
  2. 没有后面的FC,而是改用卷积的形式
  3. 还是打格子了,只是每个格子用一个卷积核来算,卷积核跑过一遍后,每个点就对应每个这个位置作为格子一角的分数
  4. 取值的时候,PR对应的区域在map上打格子,属于同一个格子的点求平均(比如深蓝色属于左下角,但是PR只要ROI上的一小块,而不是整个ROI,最后这样组合起来投票)

 

五.YOLO (you only look once)

  1. 最后又经历过FC
  2. 既然是7*7,应该是对大目标比较好

 

六.Yolo2

  1. 主要是trick(以前的问题现在看来是trick
  2. Anchor居然没有
  3. DarkNet(速快,可用在移动端或者简化加速)
  4. Yolo3的时候对小目标也不错了

七.PVANet

  1.速度快性能好

  2.crelu(减半的卷积数,差不多的性能),可以借鉴

八.SSD

  1. 虽然是单阶段,但是输出层是有根据anchor来的
  2. 没有特征融合?
  3. 数据增强
  4. 输入越大越好

九.RetinaNet

  1. focal loss (单阶段不一定不好,只是训练样本的不均衡导致)
  2. 单阶段+fpn

 

十.Mask-RCNN

  1. Mask多任务
  2. ROI Align (直接在回归的pr上打格子做插值)

 

十一.DSSD

  1. 特征融合
  2. 1*1的卷积(c)最好
  3. 长宽比聚类
  4. 测试的时候删除bn层,速度1:2× - 1:5×

 

十二.RefineDet

  1. 单阶段的,快,好用,对小目标好
  2. 有类似双阶段的anchor精炼过程
  3. +号的是多尺度

 

十三.Deformable Convolutional Networks (DCN)

  1. 卷积变形(偏移)
  2. ROI偏移
  3. 慢,但想法好

十四.CornerNet

论文地址:https://arxiv.org/abs/1808.01244

https://github.com/umich-vl/CornerNet

  1. 角点检测(左上、右下)
  2. 通过embeddings确认同目标的两点
  3. 提出Corner pool,有效平滑特征图,凸显角点
  4. 最后的角点还加了offset微调,就有点像双阶段
  5. 基础网络用沙漏网络
  6. 单阶段最佳

猜你喜欢

转载自www.cnblogs.com/zhengyuqian/p/10494144.html