概要: この記事では主に、行動計画のタスクと基本概念について説明します。
記事ディレクトリ
序文
この記事では、行動計画の基本的な概念と用語を理解し、学習します。
1. 行動計画の考え方
企画の本質は検索であり、数学的に言えば、最適解を見つけるための関数を与えることであり、例えばGoogleやBaiduの検索エンジンでは、興味のあるものを検索し、それを分類するためのエントリが与えられる。
行動計画の本質も探索です。与えられた環境状態の下で、無人車両の動きの最適解を見つけます。つまり、車両のある状態がその行動に関連しています。車両はそれぞれの行動を探索します。このアクションにより、アクションからステートへのマッピングが完了します。
最新の行動計画方法:
- ビッグデータ手法を通じてアクションと状態の間のマッピング関係を見つけます。
従来の行動計画方法:
-
検索ベースのグローバル パス プランニング
-
最適化に基づく機能の最適化
-
サンプリングベースのアプローチ
-
その他のメソッド(プロパティタイプ)
2. 行動計画の性質(プランナー)
- 完全性とは、
確率の完全性や意思決定の完全性など、開始点から終了点までの経路を見つけることができるかどうかを指します。 - アルゴリズムの効率
- 最適性
- 複雑さ (複雑さの問題の解決)
- コンストレイン(制約条件下でのパフォーマンス)
(1) パス制約
(2) モーション制約
2.1 完全性
- 完全性:始点と目標点の間に道があれば必ず最適解が得られることを意味し、それが得られない場合は、ナローギャップ問題の例のように解が存在しないことを意味します。渡すことはできません。
- 完全なプランナー: プランナーは、A* アルゴリズムなど、一定の期間内で常に開始点から終了点までのパスを見つけることができます。
- 確率的完全性: 開始点と目標点の間にパスが存在します。計画と検索時間が十分に長い場合は、RRT や BIT* などのサンプリング手法を使用して、このパスを見つけるためのソリューションがあることを確認できます。アルゴリズム。
- 決定完全性 (解決完全性): 原理は確率完全性の原理と非常に似ていますが、そのサンプリングは比較的決定的であり、通常はグリッド上です。
2.2 算術効率
通常、アルゴリズムの最も重要な評価指標は実行時間です。アルゴリズムの解析では動作に必要なメモリ空間も考慮する必要がありますが、技術の発展により空間は考慮すべき要素ではなくなったため、まず時間計算量が必要になります。
- 時間計算量表現 (線形):
通常は O で表されます。 - アルゴリズムの実行時間は、入力データの量に正比例します。
2.3 最適性
- 計画されたパスは特定の評価指標で最適です。
- 最適なパスがない場合は、漸近最適性を検討します。限られた回数の計画反復で得られた最適パスに近い準最適パスは徐々に収束し、各反復が最適パスに近づきます。
2.4 複雑さ
- 空間次元 (次元空間)
は剛体では 3 次元空間ですが、非剛体 (大型トレーラーや自転車モデル) では 3 次元モデルを使用するのは不正確です。 - 幾何学的に複雑な
オブジェクトがどのように交差するか、
ポリゴンとポリゴンの軌道の探索。
2.5 パスの制約
- Local Constraints (ローカル制約) は
障害物との衝突を回避します。 - 差動拘束により、
車両の進路の曲率とステアリングホイールの角度が制限されます。 - グローバル制約は
最短経路を見つけます。
2.6 ホロノミック制約と非ホロノミック制約
整合性制約: 制御可能な自由度は総自由度に等しい;
非整合性制約: 制御可能な自由度は総自由度より小さい。
3. 経路計画
動作計画の本質は、良い経路を探すことです。
3.1 どこで検索するか
では、どうやって良い道を探すのでしょうか?研究を始めるとき、人間はよく粒子モデルから研究を始めますが、それは 2 つの点になります。数学的には、点間に交点はなく、衝突する方法はありません。実際には、車両同士が衝突する可能性があります。したがって、それは 2 つの点になります。実際には、車両と障害物との衝突の問題を解決するために車両モデルを抽象化する必要があります。
構成スペース
上記の問題を解決するために、その処理ツールである構築空間の概念が提案される。
- ロボット工学: 実際の物理的制約と剛体力学の問題を考慮します。
- 制御理論:安定性とフィードバックに焦点を当て、将来の傾向を考慮します(将来の速度空間は将来衝突する可能性があります)。
- 人工知能:ロジックと実行アクションの検討、初期状態から望ましい状態への変化、Belief Space(信念空間)、マルコフ意思決定プロセスなど。
3.2 検索方法
組み合わせ手法
開始点と終了点などのすべてのノードを接続して構築されるロードマップである可視性グラフなど、正確かつ完全なソリューションのセットです。
ノード: 最初の開始点、終了点、およびすべての障害物の頂点が含まれます。障害物のエッジを含む、障害物と交差しないすべての点を接続します。視覚的なチャートを確立した後、検索アルゴリズムを使用して最短距離を見つけることができます。始点から終点までのパス。
**欠点:** 探索パスはスペースを残さずに障害物をたどることが多いため、衝突の危険性が高まります。
サンプリングベースの手法
- 決定されたサンプリング ポイント (決定完全性) には、
グリッドと道路構造図が含まれます。 - ランダム サンプリング (確率的完全性) には、
ルート構築の品質を向上させるために平滑化と後処理を必要とするランダム サンプリング手法が含まれます。
3.3 確率的サンプリング方法
従来の経路計画アルゴリズム: 人工ポテンシャル場法、遺伝的アルゴリズム、ニューラル ネットワーク、アリのコロニー最適化アルゴリズムなどはすべて、決められた空間内の障害物をモデル化する必要があり、計算の複雑さはロボットの自由度に指数関数的に関係します。多自由度環境における複雑な計画問題。
RRT
RRT ベースの計画アルゴリズムは、状態空間のサンプリング ポイントを通じて衝突を検出し、空間のモデリングを回避し、高次元の計画空間と複雑な制約計画の問題を効果的に解決できます。
RRT の特徴:
(1) 高次元空間を迅速かつ効率的に探索し、状態空間内のランダムなサンプリング点を通じて空白領域に探索を誘導し、開始点から目標点までの計画された経路を見つけます。
RRT アプリケーション:
(1) 複数の自由度を持つ複雑な環境で動的プログラミングの問題を解決するのに適しています。
RRT 疑似コード:
RRT の利点:
(1) 実装が簡単で比較的直観的である;
(2) 開始点から目標点までのパスを見つける;
(3) 空間の未踏の部分をターゲットにする。
RRT の欠点:
(1) 最適なソリューションではない
(2) あまり効率的ではない
(3) 空間全体のサンプリング
RRT*
一般的に言えば、RRT アルゴリズムは比較的効率的なアルゴリズムであり、非ホロノミック制約による軌道計画問題を非常にうまく処理できます。多くの点で大きな利点がありますが、RRT アルゴリズムはその結果の実現可能性を保証しません。パスは比較的最適化問題を解決するには、RRT アルゴリズムを改良する必要があります。RRT* アルゴリズムは、最適化アルゴリズムの 1 つです。
RRT の特徴:
(1) 初期パスを迅速に見つけることができ、サンプリング ポイントが増加し続けるため、ターゲット ポイントに到達するか最大サイクル数に達するまで最適化が継続されます; (2) 数値としての漸近最適化反復回数が増加し
、取得されるパスはますます最適化されます
(3) RRT パス生成のコストはRRT よりもはるかに小さく、時間コストが削減されます。
RRT* と RRT の違い:
(1) 親ノード (xnear) の再選択: パス コストが比較的小さい;
(2) 再配線: 新しいノードの後の乱数の冗長性を削減します。
3.4 障害物の回避
問題を単純化するために、パス計画の障害物として比較的標準的な幾何学的形状 (円、多角形、長方形など) が選択されます。
円オブジェクト
円の境界は非線形問題であり、通常、円は線形化されており、
Xnew が円に外接する正方形の中にあるかどうかを判断するだけでよく、入っている場合は衝突を意味します。
ポリゴン: 長方形(長方形の障害物)
Xnear と Xnew を結ぶ線の辺は、長方形の障害物のどの辺とも交差できません。
- Xnear と Xnew は長方形の片側にあり、行列と交差しません。
- Xnear と Xnew は、長方形の 1 辺の異なる側にあります:
(1) Xnear と Xnew が長方形の内側にある場合、交差する必要があります。 (2) Xnear と Xnew はどちらも長方形の外側にあります (勾配
法によって解決されます):
次の式を満たすと衝突が発生します。
3.5 その他の改善方法
補間フィッティング
実際のアプリケーションでは、RRT または RRT* を使用して取得された経路には不連続性が多く、車両の追跡の難しさや快適性に影響します。
したがって、既存のパス点セットと曲率に基づいて補間フィッティングを使用して、連続性と導出性の高い走行可能なパスをフィッティングし、車両の追従性と快適性を向上させます。
補間フィッティング方法:
3. Dubins は、
曲率制約と指定された始点と終点の接線方向の条件を満たす場合に、2 つの 2 次元平面 (x、y) を接続する最短パスであり、車両が次のようなシナリオにのみ適用されます。前進しています。
4. Reeds-Shepp は、
車両が前後に移動するシナリオに適しています。
固定ジオメトリにより、Dubins と Reeds-Shepp は車両と経路の間の距離を正確に計算できます。
5. スプライン、クロソイド、およびベジェは、内挿フィッティングのパフォーマンスを向上させることができます。
解決効率
基本的なアイデア: ソリューションの効率を向上させるために、ターゲットに近づき、木をよりオープンなエリアに誘導し、障害物からできるだけ離れ、障害物での繰り返しチェックを避けます。
- バイアス サンプリング (Bias Sampling) は、
サンプリング ポイントをターゲット ポイントに可能な限り偏らせます。ランダム サンプリング プロセス中に、ターゲット状態を一定の割合で挿入して、ツリーをターゲット状態に向かって拡張するように誘導し、解を高速化します。スピードを高め、ソリューションの品質を向上させます。
標準の RRT アルゴリズムは空間を均一にサンプリングします。均一なサンプリング ポイントにターゲット ポイントを追加すると、ツリーはより速くターゲットに近づくように誘導できます。 - サンプルの拒否、ツリーの枝刈り、およびグラフのスパース化により、
不良サンプルが拒否され、サンプルが成功する可能性が高まります。 - Delay Collision Check は
各入力に対応する軌跡ノードと衝突障害物にペナルティを追加します. ペナルティが高いほど, ノード拡張の確率は小さくなります. サンプリング領域を現在のツリーのローカル領域に制限し, 繰り返しを防ぐことができます.アルゴリズムの効率を向上させるために、ターゲット ノードに近い拡張の失敗を検出します。 - Anytime RRT は
、RRT を迅速に構築し、実現可能な解の記録を取得し、そのコストを記録してからサンプリングを実行します。このようにして、アルゴリズムは、実現可能な解の損失を減らすのに有益な場所にのみより多くのツリーを挿入し、それによってより良い実現可能な解を取得します。 。
要約する
この記事では、自動運転の計画制御における行動計画を中心に、行動計画の概念、性質、ランダムサンプリング手法の紹介、RRTとRRT*の比較、その改善方法について簡単に述べています。自動運転の計画と制御の方向性を学びたい学生。
気に入ってくださったお友達は、あなたの小さな手を動かしてクリックしてください。私は定期的に私の知識の要約や経験を共有します。皆さん、ありがとう!