计算机视觉图像形成几何图形和变换 3D变换

一、3D变换

这组三维坐标变换与可用于二维变换的坐标变换非常相似，并在表 2.2 中进行了总结。与在 2D 中一样，这些变换形成了一组嵌套的组。

表 3D 坐标变换的层次结构。每个变换还保留其下方行中列出的属性，即相似性不仅保留角度，还保留平行度和直线。 3*4 矩阵用第四个 [0T 1] 行扩展，形成一个完整的 4*4 矩阵，用于齐次坐标变换。助记符以 2D 绘制，但旨在建议在完整 3D 立方体中发生的转换。

1、平移(Translation)

3D 平移可以写成 ${x}' = x + t$ 或 ${x}' = \begin{bmatrix} I & t \end{bmatrix} \bar{x}$ 其中 I 是 ( $3 \times 3$ ) 单位矩阵。

2、旋转+平移(Rotation + Translation)

也称为3D刚体运动或3D欧几里得变换或SE(3)，它可以写成 ${x}' = Rx + t$ 或 ${x}' = \begin{bmatrix} R & t \end{bmatrix} \bar{x}$ ，其中 $R$ 是 $RR^T = I$ 且 $\left | R \right | =1$ 的 $3 \times 3$ 正交旋转矩阵。请注意，有时使用 ${x}' = R(x-c) = Rx - Rc$ 其中 $c$ 是旋转中心（通常是相机中心）来描述刚性运动会更方便。

参数化3D旋转是一项不简单的任务，在下面更详细地独立介绍。

3、缩放旋转(Scaled rotation)

3D相似度变换可以表示为 ${x}' = sRx + t$ 其中 $s$ 是任意比例因子。也可写成 ${s}' = \begin{bmatrix} sR & t \end{bmatrix} \bar{x}$ ，这种变换保留了线和平面之间的角度。

4、仿射变换(Affine)

仿射变换写为 ${x}' = A \bar{x}$ ，其中 A 是任意 $3 \times 4$ 矩阵，即， ${x}' = \begin{bmatrix} a_{00} & a_{01} & a_{02} & a_{03} \\ a_{10} & a_{11} & a_{12} & a_{13} \\ a_{20} & a_{21} & a_{22} & a_{23} \end{bmatrix} \bar{x}$ ，平行线和平面在仿射变换下保持平行。

5、透视变换(Projective)

3D透视变换也称单应性，在齐次坐标上运行， ${\bar{x}}' = \tilde{H}\tilde{x}$ ，其中 $\tilde{H}$ 是任意 $4\times 4$ 齐次矩阵。与在 2D 中一样，必须对生成的齐次坐标 ${\bar{x}}'$ 进行归一化以获得非齐次结果 $x$ 。透视变换保留直线（即，它们在变换后保持直线）。

二、3D旋转

2D和3D坐标转换之间的最大区别在于3D旋转矩阵 $R$ 的参数化并不直接，因为存在几种不同的可能性。

3D 旋转与 2D 旋转不同。在 3D 旋转中，我们必须指定旋转角度以及旋转轴。我们可以围绕 X、Y 和 Z 轴执行 3D 旋转。它们以矩阵形式表示如下：

$R_{x}(\theta) = \begin{bmatrix} 1& 0& 0& 0\\ 0& cos\theta & -sin\theta& 0\\ 0& sin\theta & cos\theta& 0\\ 0& 0& 0& 1\\ \end{bmatrix} R_{y}(\theta) = \begin{bmatrix} cos\theta& 0& sin\theta& 0\\ 0& 1& 0& 0\\ -sin\theta& 0& cos\theta& 0\\ 0& 0& 0& 1\\ \end{bmatrix} R_{z}(\theta) =\begin{bmatrix} cos\theta & -sin\theta & 0& 0\\ sin\theta & cos\theta & 0& 0\\ 0& 0& 1& 0\\ 0& 0& 0& 1 \end{bmatrix}$

下图解释了围绕各个轴的旋转

扫描二维码关注公众号，回复： 14175733 查看本文章

1、欧拉角

3D 中的旋转可以表示为三个角度，这些角度指定了三个连续应用于 X、Y 和 Z 轴的旋转。但您也可以将相同的旋转表示为连续应用于 Z、Y 和 X 轴的三个角度。这些角称为欧拉角或泰特-布赖恩角。在原始的欧拉角公式中，旋转是通过围绕 Z、X 和 Z 轴（或就此而言 YXY 或 ZYZ）的连续旋转来描述的。当旋转被指定为围绕三个不同轴（例如 XYZ）的旋转时，它们应该被称为 Tait-Bryan 角，但流行的术语仍然是欧拉角，因此我们也将它们称为欧拉角。

2、轴/角度（指数扭曲）

在三维旋转理论中，以Olinde Rodrigues命名的 Rodrigues 旋转公式是一种在给定轴和旋转角度的情况下在空间中旋转矢量的有效算法。通过扩展，这可用于转换所有三个基向量，以根据轴角表示计算SO(3)中的旋转矩阵，即所有旋转矩阵的组。换句话说，Rodrigues 公式提供了一种算法来计算来自so (3)的指数映射，即李代数的SO(3)，到SO(3)没有实际计算完整的矩阵指数。

3、单位四元数

单位四元数表示与角度/轴表示密切相关。单位四元数是单位长度的四向量，其分量可以简写为 $q = (q_x, q_y, q_z, q_w)$ 或 $q = (x, y, z, w)$ 。单位四元数存在于单位球面 $\left \| q \right \| =1$ 上，对映（相反符号）四元数 q 和 -q 表示相同的旋转。除了这种模糊性（双重覆盖），旋转的单位四元数表示是唯一的。此外，表示是连续的，即随着旋转矩阵不断变化，您可以找到连续的四元数表示，尽管四元数球上的路径可能会在返回“原点”之前一直环绕 $q_o = (0, 0, 0, 1)$ . 由于下面给出的这些和其他原因，四元数是计算机图形中姿势和姿势插值的一种非常流行的表示（Shoemake 1985）。