《临时笔记》 一些计算机视觉的英语术语的纪录

有些计算机视觉相关的英语文献上,有些术语在中文社区中比较少翻译,这里汇总下,作为笔记。

low-relief

典故是意大利语的basso rilievo,意思即是 ‘浅浮雕’ 之意,这里的relief有深度的意思,不过这个深度似乎指的是物体本身凸出的,或者凹陷的意思,是物体本身的属性,而不是我们理解的那种物体A离物体B之间的深度。此属于出现在了[2]中的8.2节,原文是:

We start in this section with the case of scenes whose relief is small compared with their overall depth relative to the cameras observing them, so perspective projection can be approximated by the simpler weak-perspective model of the imaging process.

这里指的relief正是要理解成为物体的属性。见[3]中的讨论,关于什么时候需要假设物体是low-belief的情况。

在这里插入图片描述

在这里插入图片描述

Fig 1. 硬币和浮雕属于可以用relief描述深度的物体。

homography matrix

homography我们看到这个词有homo-开头,就能猜到有“相似,相同”的意思,实际上,从词根而言,homography表示的是similar drawinig/projection的意思,也就是说是相似的图片。但是并不是简单的相似,homography翻译成中文是单应性, 表示的是 在不同视角下,对于同一个平面的表达,如图Fig 2所示,对于同一个平面上的点 P = ( x , y , 1 ) T P = (x,y,1)^{\mathrm{T}} ,在不同视角下的摄像机得到了图像image1和image2,对于这两个视角下的图,其对应的和平面上的 P P 点对应的点分别是 P 1 = ( x 1 , y 1 , 1 ) T , P 2 = ( x 2 , y 2 , 1 ) T P_1 = (x_1, y_1, 1)^{\mathrm{T}}, P_2 = (x_2, y_2, 1)^{\mathrm{T}} 。通过单应性矩阵,我们可以实现两个视角中的点的转换,如(注意,我们用的都是齐次坐标系):

[ x 1 y 1 1 ] = H X 2 = [ w 11 w 12 w 13 w 21 w 22 w 23 w 31 w 32 w 33 ] [ x 2 y 2 1 ] (1) \left[ \begin{matrix} x_1 \\ y_1 \\ 1 \end{matrix} \right] = \mathcal{H} \mathbf{X}_2 = \left[ \begin{matrix} w_{11} & w_{12} & w_{13} \\ w_{21} & w_{22} & w_{23} \\ w_{31} & w_{32} & w_{33} \end{matrix} \right] \left[ \begin{matrix} x_2 \\ y_2 \\ 1 \end{matrix} \right] \tag{1}
其中单应性矩阵 H R 3 × 3 \mathcal{H} \in \mathbb{R}^{3 \times 3}
在这里插入图片描述

Fig 2. 对于同一个平面planar surface,不同的摄像机的观察得到image1, image2,其可以通过单应性矩阵进行转换。

通过单应性矩阵,我们能实现视角之间的转换。

Update 2019.12.3
以上的解释不够准确,在[4]中,作者Hartley给了homography的一个很好地定义(当然,这个定义和我之前说的并不矛盾,只是我的偏向于应用,作者给的偏向于原始定义)。
单应性(homography),也被称之为投影变换(projective transformation),或者共线性(collineation)或者投影性(projectivity),这些术语都是同义的。

A projectivity is alse called a collineation(a helpful name), a projective transformation or a homography: the terms are synonymous.

至于共线性,这是单应性的最直接的体现,定义如下

对于投影空间1 P 2 \mathbb{P}^{2} ,其中有一个映射 h h 从自身映射到自身( P 2 P 2 \mathbb{P}^2 \rightarrow \mathbb{P}^2 ),当且仅当 h ( x 1 ) , h ( x 2 ) , h ( x 3 ) h(\mathbb{x_1}),h(\mathbb{x_2}),h(\mathbb{x_3}) 共线时,使得空间中的三个点 x 1 , x 2 , x 3 \mathbb{x}_1, \mathbb{x}_2, \mathbb{x}_3 也是共线。

定义很容易理解,可从Fig 2中简单看出,其中的所谓的映射 h h 也即是单应性矩阵 H 3 × 3 \mathcal{H}_{3 \times 3} ,在变换前后,直线仍然是直线,这个就称之为共线性,也就是单应性,投影性等等。因为单次变换过程中能够保留共线性,那么即便在多次变换中(也就是我上面举得例子),共线性也可以得到保留,因此就能够通过单应性矩阵在不同视角中,对同一个平面上的视点进行变换迁移了。


Reference

[1]. https://en.wikipedia.org/wiki/Relief
[2]. Forsyth, David A, Ponce, Jean. Computer Vision A Modern Approach second edition[M]// Computer Vision: A Modern Approach. 2017.
[3]. https://blog.csdn.net/LoseInVain/article/details/102869987
[4]. Hartley R, Zisserman A. Multiple view geometry in computer vision[M]. Cambridge university press, 2003. Page 32 Definition 2.9
[5]. https://blog.csdn.net/LoseInVain/article/details/102756630


  1. 简单理解成用齐次坐标表示的欧式空间即可,准确来说是定义了理想点的欧式空间,见[5] ↩︎

发布了111 篇原创文章 · 获赞 206 · 访问量 28万+

猜你喜欢

转载自blog.csdn.net/LoseInVain/article/details/102739778