承接计算机视觉教程(滚坑)之旅-上的文章,继续总结原理。
6.立体视觉
立体视觉主要研究如何借助(多图像)成像技术从(多幅)图像里获取场景中物体的距离(深度)信息。基本方法是从两个或多个视点去观察同一场景,获得在不同视角下的一组图像,然后通过三角测量原理获得不同图像中对应像素间的视差,从中获得深度信息,进而计算场景中目标的形状和他们之间的空间位置等。
6.1 立体视觉模块
一个完整的立体视觉系统需要进行6项工作:1.摄像机标定。2.图像获取。3.特征提取。4.立体匹配。5.3-D信息恢复。6.后处理。
其中后处理分为以下三类:1.深度插值。2.误差校正。3.精度改善。
6.2 双目成像和视差
双目横向模式:1.视差和深度。2.角度扫描成像。
双目横向会聚模式。
双目纵向模式。
6.3 基于区域的立体匹配
模板匹配。
双目立体匹配。
6.4 基于特征的立体匹配
点对点的方法:1.利用边缘点的匹配。2.利用零交叉点的匹配。3.特征点深度。4.稀疏匹配点。
动态规划匹配:顺序性约束。
7.三维景物恢复
7.1 由光移恢复表面朝向
利用光度立体学方法(常见的3-D景物恢复方法),实现简单,但需要控制照明。
7.2 从明暗恢复形状
7.3 纹理变化与表面朝向
1.利用纹理元尺寸的变化。
2.利用纹理元形状的变化。
3.利用纹理元之间关系的变化。
确定线段的纹理消失点。
7.4 根据焦距确定深度
借助焦距和景深的联系来确定摄像机与景物的距离。
8.运动分析
运动分析的研究目的:1.运动检测。2.运动目标检测与定位。3.运动目标分割和识别。4.立体景物重建和行动/场景理解。
8.1 运动分类和表达
运动分类:一方面,运动指摄像机和景物间有相对运动。另一方面,把图像分为前景(目标)和背景。
运动矢量场表达。
运动直方图表达。
运动轨迹表达。
8.2 全局运动检测
利用图像差的运动检测。
基于模型的运动检测。
8.3 运动目标分割
1.先分割之后再计算运动信息。
2.先计算运动信息再分割。
3.同时计算运动信息和进行分割。
8.4 运动光流和表面取向
根据运动景物的光流场确定景物表面朝向的原理和技术。
9.景物识别
目标识别分为四种:1.验证。2.推广。3.分类。4.类似。
9.1 统计模式分类
统计模式识别指根据模式统计特性用一系列自动技术确定决策函数并将给定模式赋值和分类,主要工作是选取特征表达模式和设计分类器进行分类。
模式分类原理,以图像模式为主要考虑这里。对模式的分类主要是基于决策理论的,而决策理论方法要用到决策函数。
最小距离分类器:基于对模式的采样来估计各类模式的统计参数,并完全由各类的均值和方差确定。
最优统计分类器是一种基于概率的模式分类器,使用于对随机产生的模式进行分类。
9.2 感知机
在具体的模式识别问题中,一般不知道或很难估各模式类的统计特性,所以要处理决策-理论问题最好采用之间通过训练得到所需函数的方法,这样就不需要对所考虑模式类的概率密度函数或其他概率信息做出假设。神经网络方法就是常用的方法之一。在对人工神经网络的研究中,人们设计出称为感知机的学习机器。
训练感知机的方法:
1.线性可分类。
2.线性不可分类。解决这一问题的一种方法称为德尔塔规则,它可在任一训练步骤最小化实际响应和希望响应时间的误差。
9.3 支持向量机
9.4 结构模式识别
结构模式识别也被称为句法模式识别。实现结构模式识别需要定义一组模式基元,一组确定这些基元相互作用的规则和一个识别器(称为自动机)。其中,规则是以文法/语法形式给出的,而识别器的结构由文法规则确定。
字符串结构识别、树结构识别。
10.广义匹配
10.1 目标匹配
基本的匹配度量方法:
1.Haudorff距离。
2.结构匹配量度。
基本的目标匹配方法:字符串匹配、惯量等效椭圆匹配。
10.2 动态模式匹配
需匹配的表达是在匹配过程中动态建立的。与该方法有类似地方的一种方法是局部特征焦点算法,其中焦点特征可对应剖面,而邻近特征对应邻近剖面的相对位置关系。
10.3 关系匹配
从广义上讲可以覆盖不同的抽象层次,所以可以涵盖多种匹配概念。
10.4 图同构匹配
11.场景解释
11.1 线条图标记解释
1.轮廓标记
2.结构推理
3.回朔标记
11.2 体育比赛视频排序
11.3 计算机视觉系统模型
1.多层次串行结构。2.以知识库为中心的辐射结构。3.以知识库为根的树结构。4.多模块交叉配合结构。
11.4 计算机视觉理论框架
马尔视觉计算理论
对马尔理论框架的改进
新理论框架的研究
这三篇博客可以说是基本上把《计算机视觉教程》的内容给充分浓缩了,在以后学习OpenCV的时候,应用相关算法的时候,可以通过这个目录找到自己所学习的路线和概念性的东西。希望大家能把这三篇博客当作一个工具书一样查找相关名词,大致知道有哪些概念。一起努力学习吧!!!