计算机视觉中的检测与定位技术:让物体更准确地被发现

作者:禅与计算机程序设计艺术

1.简介

1.1 为什么要写这篇文章

在当前信息爆炸的时代,如何快速准确地识别、分类和跟踪视频中的物体、人脸等是重中之重。而目前最流行的方法之一就是目标检测与跟踪。那么,这个技术又该怎么用呢?作者将阐述基于深度学习的方法,从图像的特征提取、目标检测、和数据集构建三个方面对计算机视觉中的检测与定位进行探讨。希望通过这篇文章可以帮助读者了解该领域的最新进展,并且可以给出自己的建议。

1.2 读者背景及阅读目的

  • 本文适合计算机视觉/图像处理相关专业学生、工程师或其他技术人员阅读。
  • 文章将以自己亲身经验以及阅读过的论文中所提到的知识点为主线,尝试用浅显易懂的方式讲解到位。

2.基本概念和术语

2.1 目标检测

目标检测(object detection)是指在图像或者视频中寻找并识别出感兴趣的对象、场景、区域等,并给出其位置坐标或者关键点信息。它的主要目的是为研究人员提供从单张图片或视频中识别出多个目标的能力。常用的目标检测方法包括区域 proposal 生成算法(Region Proposal Algorithms)、几何形态学方法(Shape Analysis Methods)和模板匹配方法(Template Matching Methods),以及基于神经网络的方法(Neural Network based)。

2.2 检测与定位

检测与定位(detection and localization)是目标检测过程中最基础的一个环节。它通常会根据一定的规则对输

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/131875114