「コンピュータビジョンにおけるマルチビュージオメトリ」に関する注意事項(1)

1 はじめに – 複数のビューのジオメトリのツアー

この章では、この本の主なアイデアを紹介します。

1.1 はじめに – 遍在する射影幾何学

なぜ射影幾何学が必要なのかを理解するために、よく知られたユークリッド幾何学から始めます。ユークリッド幾何学では、平行線は 2 次元では交差しないと考えられており、この問題を解決する一般的な方法は、平行線が「無限遠で」交差すると言うことです。しかし、これは完全に説得力があるわけではなく、無限は存在せず、単に都合の良いフィクションであるという別の格言と矛盾します。この問題は、平行線が交差する無限遠点を追加してユークリッド平面を拡張し、それらを「理想点」と呼ぶことで無限遠点での困難を解決することで解決できます。

これらの無限の点を追加することにより、見慣れたユークリッド空間は、新しいタイプの幾何学的オブジェクトである射影空間に変換されます。私たちは距離、角度、点、線、入射などの概念を含むユークリッド空間の特性に精通しているため、これは非常に役立つ考え方です。射影空間については、それほど神秘的なものは何もありません。それはユークリッド空間の単なる拡張であり、2 本の線が常に 1 点で交わりますが、場合によっては無限遠の点で交わることもあります。

単純な 2D ユークリッド点 (x, y) は、追加の座標を追加して (x, y, 1) になるか、(kx, ky, k) として表すことができます。(x, y, 1) は座標ペア (x, y) と同じ点を表しますが、(x, y, 0) に対応する点がないことがわかります。最後の座標で除算しようとすると、無限点 (x/0, y/0) が得られます。これが無限遠点の作成方法です。これらは同次座標で表される点であり、最後の座標は 0 です。したがって、(x, y, 0) は無限遠点を表します。

平行移動と回転はユークリッド変換と呼ばれ、射影変換は同次座標での同次行列の乗算に相当し、マシンビジョン、グラフィックス、ロボット工学などで一般的な表現方法です。より一般的なタイプの変換は、線形変換の後に空間の原点を移動するユークリッド変換です。これは、空間が移動、回転し、最終的にはさまざまなスケールでさまざまな方向に直線的に伸びると考えることができ、その結果生じる変換はアフィン変換と呼ばれます。

1.2 カメラの投影

カメラ投影の原理は、投影空間から投影面への投影とみなすことができ、同次座標を 3x4 行列で変換すれば十分です。

カメラは点として見ることができます。

カメラに関しては、カメラで IAC (絶対円錐の画像) が取得できれば、カメラは校正されていると言います。

1.3 複数の視点からの再構成

2 つの写真の再構成を考えてみましょう。再構成では多くの場合、多くの解が生成されます。再構築の結果を決定するには、重要な位置にない点が少なくとも 7 つ存在する必要があります。
私たちの目標は、2 つの画像内の対応する点を知り、それらのカメラ座標と対応する 3D 座標を取得することです。この解は不確実でなければなりません。不確実性は射影変換によって説明できます。この種の再構成は射影再構成と呼ばれます。
再構成の基本的な方法は、基本行列を見つけることです。これは、2 つの画像が同じ 3D 点に対応することを意味します。
再構成の主なプロセス: 基本行列を見つけ、カメラ行列を見つけ、三角法を使用して対応する 3D 点を見つけます。

1.4 三面幾何学

3 つの画像に対応する再構成の基本原理は 2 視点再構成の原理と似ていますが、計算はより複雑になります。

1.5 4 ビュー ジオメトリと n ビュー再構成

マルチビュー再構成の場合、シーケンスごとに異なる再構成方法があり、基本的なステップはバンドル調整であり、反復的な調整が必要です。

1.6 転送

一連の画像からの 3D 再構成について説明しました。射影幾何学のもう 1 つの便利な応用は転送です。1 つ (または複数) の画像内の点の位置が与えられると、その点がセット内の他のすべての画像のどこに現れるかを決定します。これを行うには、まず、(たとえば) 一連の補助点対応関係を使用してカメラ間の関係を確立する必要があります。

1.7 ユークリッド再構築

ユークリッド幾何学を再構成する基本的なタスクは、絶対二次曲線が存在する平面と無限遠の平面を見つけることです。これら 2 つの平面が見つかる限り、すべてのユークリッド幾何学的構造がわかります。

1.8 自動校正

おすすめ

転載: blog.csdn.net/YuhsiHu/article/details/132863573