卷积神经网络-目标探测

在这里插入图片描述

  • 目标探测
    • 单个目标
    • 多个目标
    • 直接思路:局部识别
  • 传统方法:DPM deformable parts model
    • 基本思想:
      • 提取图像特征,制作出激励模版,在原始图像滑动计算,得到激励效果图,根据激励分布确定目标位置
    • 优点:
      • 方法直观简单
      • 运算速度快
      • 适应运动物体变形
    • 缺点:
      • 性能一般
      • 激励特征人为设计,工作量大
      • 大幅度旋转无法适应,稳定性差
  • 神经网络分类: R-CNN系列方法
    • 类别减少
    • 训练过程
    • 测试过程
    • 分类器的训练:
      • 直接用ImageNet模型
      • Fine-tune分类模型
        • 选择20类进行探测;对原始分类模型结构更改,最终21个目标
      • 特征提取
        • 图片计算候选区域;候选区域切分图片,变成输入大小;提取相应高级特征;存储特征
      • 单独目标探测器训练–基于候选区域微调
    • 测试过程:
      • 候选区域
      • 特征计算
      • 分类、回归
      • 后续处理
    • 评估方法:
      • mAP:mean average precision 平均精度
  • RCNN总结:
    • 优点:
      • CNN用于目标探测,利用CNN高效识别能力,大大提高性能。
      • 摆脱人为设计物品模版,方法具有通用性
      • 分类+回归,有了找到精确位置的可能
    • 缺点:
      • 为了检测一个目标,所有候选区域计算,大量卷积运算,非常慢
      • SVM训练与CNN断裂,有效信息不能用于优化模型
      • 每一类单独训练,异常繁琐
        https://blog.csdn.net/briblue/article/details/82012575
  • Fast R-CNN
    • 共享卷积计算
      • 卷积计算保持空间位置
      • 共同区域卷积计算只进行一次
      • 切割候选区 + 提取特征图 = 计算完整特征图+切割对应候选区
    • 特征一致化:max pooling
    • 相对位置回归+类别分数判定 联合学习
    • 怎么解决候选区域的生成问题
      • 神经网络特征增加一组输出(RPN) region proposal network
        • 直接产生候选区域,无需额外生成
        • 直接用于后续特征图切割
        • 简介
          • 在feature map上滑动窗口
          • 建一个神经网络用于物体分类+框位置的回归
          • 滑动窗口的位置提供了物体的大体位置信息
          • 框的回归提供了框更精确的位置
      • anchor box
        • 引入应对目标形状的变化问题(anchor就是位置和大小固定的box,可以理解成事先设置好的固定的proposal)。
          https://blog.csdn.net/qq_41329606/article/details/82658927
          https://cloud.tencent.com/developer/news/281788
  • Yolo训练
发布了56 篇原创文章 · 获赞 11 · 访问量 2409

猜你喜欢

转载自blog.csdn.net/weixin_43056275/article/details/102726887