1. 計画制御 - 理論システムの概要

概要: この記事では、計画制御の各モジュールに関連する理論的知識システムをよりよく理解するために、主に計画制御の基本コンポーネントを研究します。


序文

無人車両の計画と制御のタスクは、基本的に、無人車両の目的地と現在の環境の位置を組み合わせた周囲環境の認識に基づいて、車両の正確かつ合理的な意思決定と制御を行うことです。


1. 計画制御システムの分割方法

意思決定制御計画ソフトウェア システム全体は、次の方法に改良できます。

  1. 問題解決のさまざまなレベルに応じて、または問題解決の時間枠の長さに応じて分割します。長期、中期、短期の期間に分割するなど。
  2. 空間領域と時間領域に応じて分割します。空間パスと速度計画の内訳など。
  3. アルゴリズムの長所と短所に基づいた改良(ホモトピー検索と最適化など)

最も一般的に使用されるのは、2007 年の DARPA (米国国防事前研究計画局) の都市課題で一般的に使用される分割方法です。問題解決のさまざまなレベルに応じて分割されます。
計画制御ソリューション
トップダウンの解決方法によれば、次のモジュールに分かれています。

  1. ミッション/ルート計画: 経路計画
  2. 行動プランナー/意思決定マーキング: 行動の決定
  3. 動作計画・ローカルプランナー:動作計画
  4. モーションコントロール: モーションコントロール
  5. 車両: 車両

2. 計画管理の基本構成

1. 経路計画(ミッション・ルート計画)

経路計画とは、車両の開始位置と終了位置を結ぶ幾何学的経路を生成することを指します。
パス計画は次のように分割されます。

  1. グローバルルートプランニング(ルートプランニング):グローバル静的地図に基づいて、始点から終点までの実現可能な最適なルートを計画します。
  2. 部分パス計画(ミッション計画)

経路計画は、無人車両意思決定計画制御システムの最上流モジュールとして、出発地と目的地に基づいて最適な道路の出発地から目的地までの走行順序(車線順序)を計算する問題を解決します写真が示すように。

ルート計画

経路計画入力: 出発点、目的地、道路グラフ、コスト関数 (損失関数)
経路計画出力: 車線シーケンス (車線シーケンス)、道路セグメント (道路セグメント) は、高精度地図の描画に厳密に依存します
原理: まず、高精度地図によって描かれた道路網に基づいて、考えられるすべての道路 (車線) が一定の範囲内に分散されます。これらの点をレーン ポイントと呼びます。これらの点は、無人車両が通過できる車線位置のサンプリング ポイントを表します。点と点は、点間の点を表す有向エッジと重み付き
グラフ検索方法:

  1. ダイクストラ:
    ダイクストラのアルゴリズムは、時間計算量 O(n2) で、グラフ内の点から他のすべての点への最短経路を見つけるための、「貪欲」、「幅優先探索」、および「動的計画法」に基づくアルゴリズムです。 。
  2. A*
    A* (発音: ア スター) アルゴリズムは、非常に一般的に使用されるパス検索およびグラフ走査アルゴリズムです。パフォーマンスと精度が向上しています。
    A* アルゴリズムは、スタンフォード研究所の Peter Hart、Nils Nilsson、Bertram Raphael によって 1968 年に初めて発表されました。これは、ダイクストラのアルゴリズムの拡張と考えることができます。

その具体的なアルゴリズムの原理と手法に基づいて、次の記事で詳しく説明します。

2. 行動上の意思決定

行動意思決定は、無人車両の計画制御システム全体において副操縦士の役割を果たし、運転中の無人車両の行動と意思決定の重要な頭脳として機能します。

行動上の意思決定では、次のような多くの重要な車両情報が収集されます。

  1. 車両自体に関する情報: 現在の状態、位置、速度、方位、車線、軌跡
  2. 一定距離内の無人車両が感知する情報
  3. 旅行情報

行動的意思決定によって解決される問題は、上記の情報をすべて知り、人間の運転経験を組み合わせて無人車両の運転戦略を設計することです。

行動決定
行動決定入力:

  1. 計画メッセージ: 車両の軌跡。
  2. ステータス メッセージ: 位置、速度、方位、車線。
  3. 転送メッセージ: 無人車両の最後の行動決定サイクルでどのような決定が行われたか (車の追跡、駐車、方向転換、追い越し、車線変更など)。
  4. 障害物メッセージ:交差点付近の対象車両の状態情報、意図、予測軌跡など。
  5. 交通認識メッセージ:一定範囲内の車線変更、直進道路から左折道路に至るまでに遭遇する人道、道路標識、信号機など。
  6. 人間の経験: ドライバーの運転スタイルと運転習慣。

動作決定出力: マクロ動作決定命令。特定の実行のために下流の動作計画に供給されます。

行動の意思決定は、多くの重要な異なる種類の情報が統合されるため、純粋な数学モデルで解決するのは困難です。
ここでは、行動上の意思決定を計画するためのいくつかの一般的な方法を次のように要約します。

  1. 有限状態マシン (Finite state machine)
    有限状態マシンの動作メカニズムは大まかに次のとおりです:
    (1) システムの状態は明確かつ限定されており、状態の完全なセットの 1 つに属している必要があります
    。入力を受け付け、判断条件に従って、現在の状態を維持するか新しい状態に切り替えるかを決定します;
    (3) 維持または切り替えのプロセス中に、いくつかの事前設定された操作を実行します。
    有限状態機械は離散系と考えることができ、入力を受けるたびに判定と切り替えが行われる。

  2. ルールベースのアプローチ (ルールベースのアプローチ: 最小違反計画)


  3. 線形時間ロジック (LTL): 線形時間ロジックなどの形式的手法 (形式的手法 (STL、LTL、プロセス代数、u-calulus)) に基づいて、線形時間プロパティを記述するための非常に直観的でありながら数学的に正確な表現方法を提供します。これはシステム制約を記述するための正式な方法であり、モーダル演算子を使用して正確な時間ではなく時間の順序を示すモーダル ロジックの一種です。

  4. マルコフ決定プロセス (Markov Decision Process)
    マルコフ決定プロセス (Markov Decision Process、MDP と呼ばれる) は、強化学習における重要な概念であり、意思決定を行うプロセスです。

つまり、行動意思決定とは、現在の交通場面と環境認識情報の理解に基づいて現在の運転状態を判断し、交通規則の制約と運転経験の指導の下で合理的な運転行動を計画することです。

3. 動作計画(動作計画・局所計画)

行動計画は、狭い時空領域内で地点 A から地点 B まで無人車両の問題を解決することです。つまり、道路交通ルールに従うことを前提に、自動運転車を現在地から目的地までナビゲートする方法です。

行動計画

行動の意思決定と比較して、行動計画はより具体的である必要があり、無人車両の地点 A から地点 B への短期間での経路計画の具体的な解決策には、次のようなものがあります。

  1. どのパスを選択するか、および具体的なウェイポイント。
  2. 各ウェイポイントに到達する無人車両の速度、方向、加速度、および関連する運動変数 (加速度曲率、曲率の高逆数など)。

行動計画の入力:

  1. 環境意識に関する情報
  2. 位置情報
  3. 地図情報

行動計画の出力:

  1. 時間情報を伴う追跡

行動計画では次の 2 点を確保する必要があります。

  1. その後の期間では、点 A から点 B までの時空軌跡の生成は、ある程度の一貫性を維持する必要があります。
  2. 点 A から点 B までの軌道点を生成するには、各点の速度、方向、加速度などが、下流のフィードバック制御が実際に動作できる物理的範囲内にあることを確認する必要があります。

簡単に言うと、動作計画とは、環境と場所の認識に応じて、行動意思決定マクロ命令を時間情報を伴う軌道曲線に解釈して、最下層のフィードバック制御 (動作制御) に実際の制御を与えることです。車の操作をします。

動作計画は通常、次の 2 つの部分に分割できます。

  1. 軌道計画 (軌道計画) は、
    行動決定とマップ情報に基づいて、2 次元平面上で定義されたコスト関数の下で軌道を最適化する問題を解決します。
  2. スピードプランニング(速度計画)は、
    軌道を選択した後にどの速度を使用するかという問題を解決します。

行動計画の一般的な方法は次のとおりです。

  1. 検索ベースのメソッド
  2. 確率的サンプリング法
    確率的サンプリング法は、ランダム サンプリング法とも呼ばれ、構造検索の目的は、ターゲットのすべての好ましい構造を見つけることです。これらの立体構造は、ポテンシャル エネルギー表面の極小値に関連付けられます。より深い極小値は、ターゲットの観察可能な部分的に安定した状態に対応する可能性があります。ランダム サンプリング法を使用してポテンシャル エネルギー面を探索し、それによって極小値を特定することができます。
  3. MPC

つまり、動作計画モジュールは、特定の制約の下で最適化問題を解決することです。
レビュー:

全体的な計画プロセスは次のとおりです。
次の図に示すように、経路計画 - 行動決定 - 行動計画です。

計画プロセス

  1. 経路計画: グローバル静的地図、始点と終点の位置、損失関数に基づいて最適な道路順序を計画します。
  2. 行動意思決定:経路計画の結果と知覚予測の情報を受け入れて、車の追従、車線変更、障害物の回避、信号機の遭遇、歩行者の待ちなど、無人車両の運転方法を総合的に決定します。
  3. 動作計画: 受け入れられた行動決定の出力結果に基づいて、どの経路ポイントを通過する必要があるか、およびこれらのポイントを通過する無人車両の向き、速度、加速度などの情報を計算します。

4. モーションコントロール

動作計画によって出力された時空軌道 (軌跡) にできるだけ従うように車両を制御します。このモジュールは、無人車両の下部制御インターフェイス CABus に直接接続されています。その中心的なタスクは、無人車両によって出力された軌跡点を消化することです。上部の計画モジュール。
自身の車両特性と外部物理的要因のダイナミクス計算を組み合わせることで、車両の制御(アクセル、ブレーキ、ハンドル)をリニア制御(ドライブ・バイ・ワイヤー)に変換し、車両を可能な限り制御して実行します。軌道に沿った車両。

モーションコントロール入力:

  1. 移動軌跡
  2. ステータス情報

モーションコントロール出力:

  1. ステアリング制御
  2. スロットルコントロール
  3. ブレーキ制御

制御モジュールには主に以下が含まれます。

  1. 車両自体の制御
  2. 外部物理環境との相互作用のモデル化

一般的な制御方法は次のとおりです。

  1. PID
    PID アルゴリズムは、産業用途で最も広く使用されているアルゴリズムの 1 つで、閉ループ システムの制御において、制御システムを正確かつ迅速に自動的に修正できます。PID アルゴリズムには 100 年以上の歴史があり、クアッドコプター、バランスカー、車のクルーズ コントロール、温度コントローラーなどのシナリオで使用されています。
  2. スタンレー
    スタンレー法は、前車軸の中心から最も近い経路点までの距離である横方向制御トラッキング誤差に基づく非線形フィードバック関数であり、指数関数的にゼロに収束する横方向トラッキング誤差を実現できます。車両の姿勢と所定の経路との間の相対的な幾何学的関係に従って、車両のステアリングホイール角を制御するための制御変数を直感的に取得することができる。
  3. Pure Pursuit
    Pure Pursuit メソッドは、名前が示すように、純粋な軌道追跡です。1992 年に Craig Coulter によって提案された、幾何学的トレースに基づくパス追跡アルゴリズムです。制御方法が比較的単純かつ直接的であるため、車両の運動学・力学モデルをあまり考慮する必要がなく、調整パラメータも少ないため、自動運転車両や移動ロボットへの応用が可能です。
  4. LQR
    LQR (線形二次レギュレータ) は線形二次レギュレータであり、現代の制御理論において最も初期かつ最も成熟した状態空間設計手法です。LQR は線形フィードバック状態法則の最適制御を得ることができ、閉ループ最適制御の構築が容易です。
  5. MPC MPC
    の正式名は、Model Predictive Control モデル予測制御 (RHC、Receding Horizo​​n とも呼ばれます) を指す場合があります。
    原理: 各採用の瞬間に、取得された電流測定情報に従って、有限時間開ループ最適化問題がオンラインで解決され、取得された制御シーケンスの最初の要素が制御対象に適用されます。次のサンプリング時間に、上記のプロセスを繰り返します。新しい測定値を初期条件として使用して、現時点でのシステムの将来のダイナミクスを予測し、最適化問題を更新して再度解きます。
    特徴:MPCの最大の特徴は、LQR制御と比較して、LQRやPIDなどの制御は入出力変数の様々な制約しか考慮できないのに対し、MPCでは空間状態変数の様々な制約を考慮できることです。

要約する

この記事は主に自動運転計画制御の学習の概要を説明するものであり、主に計画制御システムの分割方法、計画制御の基本コンポーネント、および各モジュールの主な原理、問題点と共通の解決策を紹介します。理解できるようにする 自動運転の計画と制御の方向性を理解して学びたい学生に役立ちます。
気に入ってくださったお友達は、小さな手を動かしてフォローしてください。私は定期的に私の知識の要約や経験を共有します。ありがとう!

おすすめ

転載: blog.csdn.net/guozhengxian123/article/details/130598260