2019“智见AI” Spring Camp知识点简要汇总-目标检测方向

目标检测方向

  1. 大佬们都提到的当前检测遇到的问题
    1. 当前网络对检测不太友好,预训练一般在ImageNet等用来分类的数据库上
    2. 正负样本的失衡
    3. learning everything(anchor,NMS)
    4. anchor-based 和 anchor-free
    5. 检测的细节(小尺度物体和物体堆等)
  2. 俞刚《Beyond RetinaNet and Mask R-CNN》
    参考:https://www.megvii.com/newscenter/e2da1146-7209-44b1-aac5-1f4aab6d091a
    1. 目标检测本质上同时在做定位和分类两个任务。
    2. 目标检测的目的在于又快又准,快在于实时性,准体现在定位准和分类准。
    3. 当前主要的检测的细节仍需完善,如小物体检测、物体堆识别等。
    4. RetinaNet 和 Mask R-CNN 是 2017 年出现的两个非常有代表性的成果, 两者分别是 one-stage 和 two-stage 的,共同奠定了目标检测框架的基调。
      RetinaNet:https://arxiv.org/abs/1708.02002
      《Mask R-CNN》:https://arxiv.org/abs/1703.06870
    5. one-stage 和 two-stage 检测器之间的本质区别在于检出率(recall)与定位(localization)之间的权衡(tradeoff)。
    6. 当前可改进的点:
      1. 当前主干网络多基于ImageNet分类任务来设计,所以可以考虑针对检测任务设计骨干网络,朝着兼得感受野和空间分辨率的方向而努力。
      2. 对于two-stage网络,当前主要的目标是加速,可以通过减小骨干网络,把head变为轻量级等方式。
      3. 检测中物体尺寸差异较大,如何在尺寸变化与推断速度之间实现一个很好的权衡,结合了anchor-based和anchor-free的方法,
      4. 物体检测的batchsize都比较小,MegDet
      5. 真实场景中 crowd 情况非常多,引入了一个新数据集——CrowdHuman。
      6. 新增-pretraining
        在这里插入图片描述
        预训练可以节省训练时间,且提出了名为Objects365的数据库用来预训练效果会比ImageNet更好,更适合于检测问题。
        在这里插入图片描述

目标检测算法总结博客:https://www.cnblogs.com/guoyaohua/p/8994246.html

  1. 张士峰《物体检测算法的对比探索以及展望》
    1. 物体检测的分类
      在这里插入图片描述
    2. RefineDet演变
      anchor-based里one-stage和two-stage各有优缺点,two stage的优势在于它有两次的特征,分类和检测,所以精度较高,但one-stage的速度较高
      基于此,就提出来RefineDet,结合两种模式的优缺点,ARM部分负责用来得到bbox(类似Faster R-CNN中的ROI或proposal)和去除一些负样本,ODM采用ARM产生的refined anchors作为输入,进一步改善回归和预测多类标签。
      在这里插入图片描述 后发现浅层网络的ODM模块,浅层更适合用来分类,深层部分更适合用来回归框架结构,因此提出SRN
      在这里插入图片描述
    3. anchor-based 算法缺点
      1. 与锚点相关的超参(scale、aspect ratio、IOU Threshold)必须被小心选择,否则会较明显的影响最终预测效果
      2. 预置的锚点大小、比例在检测差异较大物体时不够灵活,且在迁移数据后需要重新设计
      3. 较高召回率,多个锚点box被紧密排列,而绝大多数锚点都被标定为negative,这样会导致正负样本比例失衡
    4. anchor-free的算法:基于keypioint和基于segmentation
      但anchor-free也存在自身的问题,如如何配对keypoint等
      在这里插入图片描述
  2. 程明明《开放环境下的自适应视觉感知》
    1. 富尺度空间深度神经网络通用架构,层内分层分组递进残差连接。
      在这里插入图片描述
    2. 通用视觉基元属性感知(基元属性:显著性、边缘、对比度等一系列图像中的固有属性,该属性不具有针对某种特定任务的性质)
      显著性物体检测(A Simple Pooling-Based Design for Real-Time Salient Object Detection)
      在这里插入图片描述在这里插入图片描述Contrast Prior and Fluid Pyramid Integration for RGBD Salient Object Detection(RGBD显著性物体检测)
      在这里插入图片描述
    3. 关键机器学习算法到多种行业应用
      在这里插入图片描述
    4. 总结
      在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Evabook/article/details/89967008