3D復元の展望
- CV の 2 つの主要なタスク オブジェクト認識、3D 再構成
- 自動運転、VR、ARコア
- 古代建築の修復・復元における3D復元の代表的な応用例
- 一般的に言われる自動運転(三次元認識)
コンピュータビジョンよりも難しく、物体認識(写真が猫か犬かを識別する)(行動分類タスク:人が座っているか立っているか)を考えると、すべてコンピュータのオブジェクトです。ビジョンを特定します。
コンピュータビジョンの目標: 画像を理解すること
研究目的: 画像から視覚的特徴を取得すること。
3D再構成の開発プロセス
- 1987年にロンドンで開催された最初の国際コンピュータビジョン会議ICCV
- コンピュータ ビジョンの目標は画像を理解することです
- 研究の目的は画像から視覚的特徴を取得することです
- 1980 年代には誰もがエッジに基づいてエッジ抽出を行っていましたが、1986 年には Canny エッジ検出が登場しました。
- 1990 年代になると、3 次元の再構成がますます注目されるようになり、一次元のエッジは幾何学計算には適さない、幾何学の最も重要な要素は点である
- 1992 年、オリーブ フォーゲラスとリチャード ハートルは、校正されていないカメラの 2 つの画像の下での 3 次元再構成の問題を独立して解決しました。
3D再構築分類(アクティブ、パッシブ)
- ステレオビジョン(両眼立体視再構築)
- 深度画像
学習ステップ
- 画像処理関連知識:画像特徴抽出(ハフ変換、D2-Net、SIFT)
- カメラモデル学習(3D空間から2Dへのマッピング):カメラキャリブレーション、最適化アクセラレーション
- 3D再構築:双眼システム、ステレオマッチング(SIFT、パスマッチ、構造化光)
- 動きからの構造 (極幾何学、必須マトリックス)
- 剛体の変換
学習の方向性
- 高精度3D再構成
- 大規模な 3D 復元
- 動きによる非剛体構造
- 動的3D再構成
この記事は、bilibili の動画やインターネット上にある多くの資料を参考にして、自分が見やすいように自分で勉強したメモです。