计算机视觉:算法与应用(笔记_2.1

本书第一章主要是内容的概述,我就不再进行整理了。所以我们从2.1开始。

2.1标题为几何基元和变换,主要涉及的大多为二维和三维空间中的点线面定义以及相应的变换,当然如果有计算机图形学基础可自行跳过。(本菜鸡啥也不会,只能老老实实看书了嘤嘤嘤

2.1.1 几何基元(主要是定义

一、二维平面


  • 非齐次表达式:在这里插入图片描述

    齐次表达式:在这里插入图片描述
    其中,在这里插入图片描述称为增广矢量

    我们可以把W当作该点到原点距离的倒数,W=0,可以视作该点距原点无穷远,这样就实现了齐次与非齐次表达式之间的转换。而后续计算往往需要用到的是增广矢量,所以我们只需要简单地把增广矢量当作是二维坐标点在原有横纵两个坐标的基础上添加一个恒为1的参数。

  • 线
    齐次表达式:在这里插入图片描述
    对应的直线方程:在这里插入图片描述
    以及规范化直线方程在这里插入图片描述其中向量n为垂直于直线的法向量,d为直线与原点距离。
    这里还有两个计算公式, 已知两直线求交点在这里插入图片描述 分别对应了已知两直线求交点和已知两点求直线的情形

  • 圆锥曲线
    书中仅简略介绍,后续内容涉及不多


二、三维空间


  • 非齐次表达式:在这里插入图片描述
    齐次表达式:在这里插入图片描述
    增广矢量:在这里插入图片描述

    基本上可以完全对照二维平面的表达式,只是在二维基础上多了一维参数

  • 平面
    齐次表达式:在这里插入图片描述
    对应的平面方程:在这里插入图片描述
    以及规范化平面方程:在这里插入图片描述,其中向量n为垂直于平

    面的法向量,d为其到原点的距离。(可类比二维平面的直线
    我们还可以将向量n表示为两个角度的函数:在这里插入图片描述

(这一标准与本人所学的哈工大工科数学分析教材中有所区别,但是原理一致,在这里不做过多说明了

  • 直线
    直线的表达就没有上面的式子那么优美了(书上原话【滑稽】),一种表达方式是通过两个点(p,q)表示:r = (1-

λp + λq. (当我们限定0<=λ<=1时,得到的便是p,q间的一条线段

当然我也可以直接写成r = μp + λq的形式

  • 二次曲面
    和圆锥曲线一样,书中并没有详细介绍

2.1.2—2.1.4 各种变换
首先是二维(注:二维坐标变换所用的点坐标表达式均为增广矢量

  • 平移
    在这里插入图片描述,x和y分别是横纵坐标平移的单位距离

  • 旋转
    在这里插入图片描述,θ为逆时针旋转角度

  • 放缩
    在这里插入图片描述,x和y分别是横纵坐标放缩的比例

  • 仿射
    书上介绍过于简略,博主没能看懂,这里贴一位大佬的博客,讲的特别详细

  • 投影
    也可以称为透视变换或者同态变换,是作用在齐次坐标下的
    在这里插入图片描述,其中H是任意一个三阶方阵(书上没仔细说这个三阶方阵的每一个参数都是什么含义,我也很蒙B啊。

翻到另一位大佬的博客
在这里插入图片描述
在这里插入图片描述


接下来是三维空间,平移和放缩均可对比二维进行类推,此处重点介绍三维空间的旋转

三维空间中主要有三种旋转参数的选择:欧拉角,轴/角和单位四元数

  • 欧拉角
    该旋转系有三个参数,分别是方向向量与三个坐标轴所成方向角。这种参数选择在参数空间中并不能光滑地移动,所以很少使用

  • 轴/角(指数扭曲)
    该旋转系有四个参数,分别是旋转轴的三个方向向量(单位向量)和旋转角度,可以得到如下变换矩阵公式:
    在这里插入图片描述
    详细推导可见该链接:https://www.cnblogs.com/jiahenhe2/p/7954707.html

  • 单位四元数
    一个很有用的引入参数,还是拉一个链接:http://www.twinklingstar.cn/2016/2772/orientation/
    上面的链接很详细地讲解了四元数,还有轴角和欧拉角的讲解,也是一篇质量非常高的博客

关于旋转参数的选择,轴角和四元数各有优势,但是本书作者Richard Szeliski表示自己会优先考虑四元数,但是会使用增量旋转来更新估值


本小节最后还有一部分讲述了二维到三维的投影,镜头畸变等问题,很惭愧博主没能理解,无法进行整理。(再一次嫌弃自己好菜
然后因为我的主要工作是整理,所以会引用很多别人的博客,谢谢那些大佬的提点,我也确实需要向他们学习。
这是我的第一篇博客,写了好久,虽然写的很乱,但是至少是一个积极的开始。期待大家的批评指正,我接下来还会继续学习继续更新的。

发布了4 篇原创文章 · 获赞 12 · 访问量 683

猜你喜欢

转载自blog.csdn.net/weixin_43152951/article/details/96483897