3Dターゲット検出手法に関する研究のレビュー

[要約]3D ターゲット検出は、自動運転、仮想現実、ロボット工学などの応用分野における重要な基本問題です。その目的は、ターゲットの最適な説明を抽出することです。無秩序な点群からの正確な 3D ボックス (歩行者や車両の点群を密に取り囲むものなど) で、ターゲット 3D ボックスの位置、サイズ、方向を示します。現在、両眼視、RGB-D カメラ、ライダーに基づいた純粋な点群に基づく 3D ターゲット検出と、画像と点群からのマルチモーダル情報に基づく 3D ターゲット検出の 2 つの主な方法が使用されています。まず、3D 点群のさまざまな表現形式と特徴抽出方法が紹介され、次に、従来の機械学習アルゴリズム、非融合深層学習アルゴリズム、マルチモーダルに基づく深層学習アルゴリズムの 3 つのレベルから層ごとに紹介されます。さまざまな 3D ターゲット検出手法をカテゴリ内およびタイプ間で分析および比較し、さまざまな手法間の違いと関連性を詳細に分析します。最後に、3D ターゲット検出の残りの問題と考えられる研究の方向性について説明します。 3Dターゲット検出研究の主流のデータセットと主な評価指標をまとめました。

[キーワード]  ディープ ラーニング、3D ターゲット検出、マルチモーダル フュージョン、点群、自動運転

0 まえがき

自動運転、ロボット、ドローンなどの応用分野では、周囲の環境を記述するためにライダーや両眼視、RGB-Dカメラなどを用いて3次元点群を構築することがよくありますが、点群情報は乱雑でセマンティック性が欠如しています。点群内の移動するターゲットを検出するため、または点群に基づいてターゲット検出と人間とコンピュータの対話を実現するために、ターゲットを最も正確に記述する 3D 点群フレームが順序付けされていない点群フレームから抽出され、その空間位置がターゲットの 3D フレーム、サイズ、方向が指定されます。このプロセスは 3D ターゲット検出と呼ばれ、上記の種類のアプリケーションの重要な基盤です。

具体的には、視覚センサー(単眼、両眼、RGB-Dを含む)やレーダーセンサー(超音波レーダー、ライダー、ミリ波レーダーを含む)、融合測位センサー、慣性計測ユニットなどによる処理により3D点群を取得できます。画像または点群データは、ビジュアル オドメトリまたはレーダー オドメトリ方法によって構築されます。点群では、その表面が

おすすめ

転載: blog.csdn.net/fzq0625/article/details/134916011