古典文学の読解 -- RigidFusion (動的障害物 SLAM)

0. はじめに

実際の SLAM シーンでは、多数の動的な障害物があるシーンに遭遇すると、特に軌道を見失う問題が発生しやすいことがわかります。従来の解決策は動的障害物をフィルタリングすることですが、この記事「RigidFusion: 大きな動的剛体オブジェクトを含む環境におけるロボットの位置特定とマッピング」では、動的オブジェクトが剛体として追跡されると述べています。この記事はそれほど革新的なものではありませんが、研究状況が非常によくまとめられています。現在、この記事のコードはオープンソースではありませんが、ビデオによる説明があります。この論文では、カメラの視野の大部分を覆い隠す可能性のある静的な背景と大きな動的剛体オブジェクトの両方を同時にセグメント化、追跡、再構築できる新しい RGB-D SLAM 手法を提案します。以前の方法は、シーンの動的部分を外れ値として扱うため、シーン内の小さな変化に限定されるか、堅牢なカメラ追跡のためにシーン内のすべてのオブジェクトに関する事前情報に依存していました。この論文では、すべての動的パーツを剛体として扱い、静的パーツと動的パーツの両方をセグメント化して追跡することを提案しますしたがって、動的オブジェクトによって引き起こされる大きなオクルージョンがある環境では、静的な背景と堅固な動的コンポーネントを同時にローカライズして再構築することができます。

RigidFusion: 大規模な動的 Ri を持つ環境におけるロボットの位置特定とマッピング

1. 記事寄稿

無人倉庫内での物体の取り扱いと輸送 これらのタスクにはロボットの移動操作が必要であり、ロボットが動的物体からの外乱に対して堅牢でありながら、移動する静的環境に位置し、操作する必要がある物体を追跡する必要があります。これら 2 つの問題は以前に別々に取り上げられましたが。しかし、両方のタスクを同時に解決することはまれです。
ここに画像の説明を挿入

  • 新しい SLAM フレームワークは、RGB-D カメラを使用して、静的な背景と動的な剛体の構築を完了する潜在的なドリフトを伴うモーション プリアを使用して、SLAM フレームワーク全体でシーンを同時にセグメント化し、追跡し、再構築します。

  • 視覚入力内の大きな動的オクルージョン (視野の 65% 以上) に対して堅牢な高密度 SLAM マッピングを使用する方法。同時に、SLAM モデルは静的モデルと動的モデルの初期化に依存しません。

  • 新しい RGB-D SLAM データセットが提供されます。これには、シーン内の大きなオクルージョンを持つ動的オブジェクトと実際の軌跡が含まれます。

2. 詳細

この論文では、動的パーツを単一の剛体として扱い、モーション プリアを使用して静的パーツと動的パーツをセグメント化する SLAM フレームワークを提案します。セグメント化された画像を使用してカメラを追跡し、背景とオブジェクトのモデルを再構築します。

以下の図は、この方法の再構成プロセスを示しています。まず、2 つの連続する RGBD キーフレーム A および B と、静的オブジェクトと動的オブジェクトの事前情報が必要です。静的オブジェクトと動的オブジェクトの事前情報は、ξ ~ s \tilde{ ξ } _sバツ~sξ ~ d \チルダ{ξ}_dバツ~dse ( 3 ) se(3)に属しますse ( 3 )、さらに、前のフレームのセマンティック セグメンテーション情報が必要ですΓ ~ A ∈ R w × h \tilde{\Gamma}_A\in \mathbb{R}^{w\times h}CR×高さまず、動きの事前情報に従って物体が動的物体であるかどうかを検出し、次に物体が動いている場合、フレーム間の位置合わせに基づいてセグメンテーション Γ ~ B \tilde{\Gamma}_B を共同推定しますCBと剛体運動ξ ~ s \tilde{ξ}_sバツ~sξ ~ d \チルダ{ξ}_dバツ~dこれらのクリップは静的環境と動的オブジェクトを再構築するために使用され、モデルに対するフレームの位置合わせはカメラの位置決めに使用されます。
ここに画像の説明を挿入

2.1 画像の集約

[4] と同様に、それぞれの新しい強度と深さの画像( I , D ) ∈ RW × H (I,D) ∈ \mathbb{R}^{W×H}(D )RW × Hペアは、K 平均法クラスタリング (g K-Means) を使用して K 個の幾何学的クラスターに分割されます。V = { V i ∣ i = 1 , ⋅ ⋅ ⋅ , K } V =\{V_i| i = 1 ,... · 、K\}V={ V私は=1 、⋅⋅⋅、K } . 各クラスタが剛性条件を満たすと仮定すると、各剛体はクラスタの組み合わせで近似できる。同時に、各クラスターにはスコアγ i ∈ [ 0 , 1 ] γ_i ∈ [0,1] がc私は[ 0 ,1 ] は、クラスターが静的剛体に属する確率を表します:γ i = 0 γ_i=0c私は=0 は動的クラスターを意味し、γ i = 1 γ_i=1c私は=1 は静的クラスターを示します。RGB-D フレーム A の場合、全体のスコアをγ A ∈ RK γ_A ∈ \mathbb{R}^KcRK。 _

2.2 距離判定

2 つのモーション事前分布の差∣ ∣ ξ ~ s − ξ ~ d ∣ ∣ 2 ||\tilde{ξ}_s− \tilde{ξ}_d||^2∣∣バツ~sバツ~d2はしきい値d ^ \hat{d}d^、画像内のすべてのクラスターが静的セグメンテーションおよび動きセグメンテーションの対象となります。それ以外の場合、現在のフレームのスコアcB静的および動的剛体の相対運動ξ s ξ_sバツsξ d ξ_dバツd

2.3 画像の分割

次に、ピクセルレベルのセグメンテーション Γ ~ B ∈ R w × h \tilde{\Gamma}_B\in \mathbb{R}^{w\times h} がクラスターとスコアから計算されますCBR×高さ静的融合と同様に、セグメンテーションから静的および動的剛体のΓ 〜 B \tilde{\Gamma}_B をCBこれらの重み付けされた画像は、背景と動的オブジェクトのモデルを再構築し、フレームモデルの位置合わせによって推定されたカメラのポーズを調整するために使用されます (セクション V)。

…詳しくは顧岳州を参照

おすすめ

転載: blog.csdn.net/lovely_yoshino/article/details/127527794