【論文ノート】高速道路自動運転に向けた運動計画の見直し

ここに画像の説明を挿入します

I.はじめに

まず、一部の自動運転車の起源、関連する運転支援技術の応用、関連政策と基準、DARPAチャレンジ、その他の自動運転車プロジェクトの状況と進捗状況を紹介します。


著者は、モーション プランニングに関する以前のレビューと文献をいくつか紹介します。

  • ロボット工学分野: [20]、[21]、[22]。
  • 自動運転: [23]、[24]、[25]。

  • 工業的に現実的な自動運転車のプロトタイプに適応するための研究の標準化は、機能安全、リアルタイム コンピューティング、システム アプローチ、低コスト開発などの新たな問題をもたらし、駐車場、交差点管理、高速道路の運転などの特定のシナリオへの適用も可能にします。 . .
  • 高速道路での自動運転を研究する理由:
    • 環境はシンプルで、道路構造もシンプルです。
    • 運転行動は制限されており、洗練されていません。
    • 完全自動運転の実現がより容易に。

II. 高速道路の移動計画に関する考慮事項

A. 用語

このパートでは、いくつかの基本的な用語と概念を紹介します (完全には文書化されていません)。

  • 構成空間: 幾何学的状態空間 (ロボット構成空間)。
  • 進化空間:車両が時空間的に安全に移動できる領域を指します。

どちらにも以下が含まれます:

  • 衝突スペース: 障害物と衝突します。
  • 不確実な空間: 障害物と衝突する可能性があります。
  • フリースペース: 障害物に衝突しません。

  • 著者は、経路、軌道、操作、アクションシーケンスの構築を計画と区別しています。

B. 動作計画スキーム

  • [18]、[24]、[27] これら 3 つの文書では、自動運転の階層アーキテクチャについて説明しています。

著者は、典型的なレイヤリング パターンを紹介します。

ここに画像の説明を挿入します

  • モーション戦略入力:認識位置特定、および通信
    ( Vehicle-to-X-V2X ) モジュールから取得される自車、障害物の挙動、およびインフラストラクチャに関する関連情報。(収集方法ではなく、測定の品質、不確実性、信頼性を重視)
  • シーン表現: 車両、障害物、周囲環境、交通などを含む知覚マップを提供します。
  • 知覚、位置特定、および通信 (Vehicle-to-X -
    V2X) モジュールから動作戦略モジュールまで、閉ループ システムが形成され、現在および将来の情報が送信されます。
  • コントロール:制御、実行(作動)。
    閉ループシステム: 現在の車両の一部のステータスをモーション部分にフィードバックします。
  • ドライバーとのインタラクション: ドライバーにリスクを警告し、ドライバーの意図をフィードバックします。

この記事で著者が提案した階層化アプローチは次のとおりです。
ここに画像の説明を挿入します

  • (i)ルート計画:グローバルプランナー。
  • (ii)予測:現在および過去の情報に基づいて、周囲の環境の変化を推測する予測。
  • (iii)意思決定
  • (iv)世代
  • (v)変形

変形とは、動作計画において生成された動作軌道を微調整して環境や特定の制約に適応させるプロセスを指し、これにより動作計画の精度実現可能性が向上します。このプロセスは、高レベルの戦略低レベルの戦略の2 つの段階に分けることができます高レベルの戦略段階では、複数の可能な動作軌道が生成され、特定の評価基準に基づいて最適な軌道が選択されます。低レベルの戦略段階では、軌道を微調整することで環境や制約に適応します。変形は、障害物を回避し、軌道の連続性を維持するために、生成された運動軌道をリアルタイムで調整できる反応戦略とみなすこともできます


最近の研究 [32]、[33] では、動作計画方法は主に高レベルと低レベルの 2 つの部分に分かれています。

  • 高レベル (予測): リスク評価、基準の最小化、および制約の提出の 3 つの部分が含まれます。これら 3 つの部分は主に意思決定部分で使用されます: 一連の計画の軌道から 1 つを意思決定として選択するか、最初に意思決定を行ってからそれに応じて計画を立てます。高レベルでは、より長い視野の予測からメリットが得られますが、時間がかかります。
  • 低レベル (リアクティブ): モーション生成プロセスをリアクションベースの方法に置き換えます。

ここに画像の説明を挿入します
表は各モジュールの距離範囲と時間範囲を示しています。

C. 高速道路走行の特殊性

著者が主に検討しているシナリオは、時速60kmを超える構造道路上の一方通行の交通の流れに限定されています。都市部の道路シーンと比較すると、交通動作はよりシンプルかつ均一です。

この記事では、著者は主に次の 8 つの状況に焦点を当てています。

  • 車線維持
  • 後続車
  • 車線変更
  • 最外側車線変更:最外側車線への車線変更。
  • 通過
  • 追い越し
  • 結合
  • 高速道路料金:高速料金所。

  • 編隊走行のための運動計画には、より強力なロバスト性と安定性が必要です。関連文献: [35]。
  • 高速動作計画と都市道路ベースの動作計画の主な違いはプレビュー時間で、前者の方がプレビュー距離/時間が長くなります。

D. 高速道路走行の制限

  • 厳しい制約: 交通ルールの考慮と衝突の回避
  • ソフト制約: 時間、距離、エネルギー消費の最小化、快適性を考慮します。
  • その他の実現可能性制約: 車両の非整合性制約、滑らかな経路 - 軌道は微分可能で連続的な曲率である必要がある、車両ダイナミクスの制約。
  • 仮想ポテンシャル場に基づく方法や数値最適化方法を除き、ほとんどの方法では車両モデルがほとんど、またはまったく考慮されていません。
  • 時間とともに変化する動的制約(単調性など)。

E. この文書で問題となっているもの

このセクションでは主に高速道路自動運転のモーション戦略アルゴリズムに焦点を当てており、リアルタイムの有効性を重視し、数学的な複雑さには固執しません(シンプルがベスト!)。著者らは、実用化の観点からアルゴリズムを分類し、シミュレーションや実験を考慮してその利点と欠点を分析します。最適性と比較して、実現可能性の方が重要です。高速道路の運転では、少なくとも 1 つの連続動作戦略を確保することが重要です。

Ⅲ.最先端の

モーション プランニングに関する質問:

  1. シーン表現によって渡されるデータはさまざまなタイプ (離散/連続、代数/解析、または静的/動的) であり、それに応じて動作計画の問題の形式も異なります。
  2. 動作計画は、(i) 状態推定、(ii) 時間発展、(iii) アクション計画、(iv) 標準最適化、および (v) 制約への準拠という 5 つの必然的な側面を組み合わせます。これらにどのように対処するかによって、対応する問題が変わります。

A. 分類の説明

著者が動作計画の手法をどのように分類しているかを説明する

分類機能:

  • 出力のタイプ: 空間、パス、軌跡、操作、または記号表現。
    • 同時に、アルゴリズムが分解モーションを返すか参照モーションを返すかを考慮する必要もあります。前者はset-algorithmと呼ばれ、実行可能な動きを見つけるために相補的なアルゴリズムを必要とし、後者はsolve-algorithmと呼ばれます。
  • 時空特性:予測的または反応的な地平線。
  • 使用される数学的領域 (方法): 幾何学、ヒューリスティック、ロジック、コグニティブ、バイオミメティック (幾何学、ヒューリスティック、ロジック、コグニティブ、バイオミメティック) に基づきます。
    • 幾何学的手法は空間の特性に基づいており、環境と車両自体の空間制約 (運動学的制約) を直接処理します。次に、大規模な宇宙探査と最適化の問題に対処する必要があります。
    • ヒューリスティックなヒューリスティック手法は、問題に関する知識に基づいて近似解を迅速に見つけ、計算の複雑さと道路渋滞を回避しますが、最適な解が見つかることは保証されません。
    • 論理論理法とは、推論に基づく演繹法を指し、結果と原因を結びつけやすいが、組み合わせ爆発が起こりやすい。
    • コグニティブ認知手法は、事前知識と常識に依存して状況を評価し、人間の意思決定プロセスを模倣しますが、自動運転アプリケーションでの経験は不十分で、理論的妥当性は検証されておらず、認知ベースのアルゴリズムは認識されていません。ドライバーの行動は複雑かつ非合理的であるため、モデル化が困難です。
    • バイオミメティックアプローチ。実装は簡単ですが、無限ループ動作を引き起こす可能性のある物理法則に従う、物理学にヒントを得たアルゴリズムを説明します。システムの収束を得るには、実行可能なソリューションを使用する必要があります。

ここに画像の説明を挿入します

次に紹介するいくつかのアルゴリズムの分類レーダーチャート

B. アルゴリズムの分類

1) 空間構成

空間構成アルゴリズムの主な難しさは、適切なパラメータを使用して動きや環境空間を表現することであり、空間の離散化の程度を十分に考慮する必要があります。

このタイプのアルゴリズムの主な考え方は次のとおりです。

  1. 進化空間のサンプリングまたは離散化。
  2. 実行不可能な領域または衝突領域を削除します。
  3. 残りの部分を自由空間制約として使用するか、パスファインディング アルゴリズムまたは曲線計画を使用します。

ここに画像の説明を挿入します

a) サンプリングベースの分解

主に次の 2 つの方法があります。

  1. 運動学的制約に基づいた進化空間でのサンプリングには、より高い計算コストが必要です。
  2. ランダム サンプリングは計算が高速ですが、サンプリング分布に依存するため、再現性がなく不完全です。
    どちらも最適ではなく、完全性は保証できません。

ただし、サンプリング方法は動的再計画に使用でき、障害物空間のモデリングを必要としません。

  • より典型的なアルゴリズムである PRM は、自動運転の経路計画を詳細に紹介しています。これは、著者 [33] によって言及されている確率サンプリングに基づく経路計画アルゴリズムであり、基準線に基づいてサンプリングし、目的関数を使用して最適なノードを見つけます。を設定し、パス上の速度分布を設定します。
  • より良い戦略は、時間次元と空間次元の両方を考慮することです (時空間サンプリング) [43]。
  • ただし、上記の方法は構造化された道路ではほとんど使用されず、主に構造化されていない環境で使用されます。
b) 接続セルの分解

セル分解では、まず幾何学的情報を使用して空間をいくつかのセルに分割し、次に対応する位相構造を構築します

ここに画像の説明を挿入します
図 5 は、さまざまなセル分解の関連アプリケーションを示しています。主に以下の2種類の方法(障害物表現方法または障害物によらない表現)が挙げられます。

  • 占有グリッド(占有グリッド):障害物情報や不確実性を考慮したグリッドですが、大きな記憶領域と大量の計算量が必要となり、動的障害物に遭遇した場合にエラーが発生しやすくなります。

  • 接続性グラフ: ノードはセルを表し、エッジはセル間の関係を表します。

  • 障害物の表現方法

    • 凸多角形 [45]、長方形 [46]、三角形 [47]、円 [48]、[49]、[50]、楕円形状 [32]、[51]、または障害物のサイズと速度に基づく全体の形状。道路車線[52]
    • 確率的占有法は[53] で採用されました
  • 障害物に基づいていない:

    • 最も直観的な方法は、図 5(e)の正確な分解です。MDP は [50] で使用されました。
    • 非ホロノミック制約を考慮した曲線グリッドまたは極グリッドは、計算が複雑で精度が限られているため、削除されました。
    • ベクトル フィールドヒストグラム(VFH)[56];[57] は運動力学的制約を考慮しました。VFH は不確実性に対してより堅牢です。
    • DWダイナミックウィンドウ方式。探索空間を縮小し、計算量を削減することで、動的な障害物回避が可能になります。
    • ボロノイ分解: 欠点: セル サイズが一貫していない、運動学的な実現可能性が欠如している、動的なシーンには適していない、等間隔では安全性が保証できない。適切な方法を使用した後でも動的なシーンに適応するのが難しいという問題が残ります。
    • 可視性分解:図5(a);
    • 走行コリドー: 図 5©、道路境界と障害物の時空間位置を使用。[49] は、動的な走行通路を構築するために速度障害物を使用しました。欠点: 計算時間が長い。

要約すると: セル分解は、障害物情報を使用しますが、道路の関連ドメイン知識を無視するため、高速道路計画ではまだ主流の方法ではありません。高速道路計画では、動的な障害物の制約と道路の制約を組み合わせる必要があります。

c) 格子表現
  • 通常、格子はグリッドに基づいて生成でき、関連するモーション プリミティブを定義して、接続された状態 (制御空間の状態または状態空間の状態) を接続できます。
  • ラティスは主に上記の予測計画に使用されます
  • 利点: 車両のダイナミクス制約と時空制約を考慮し、オフラインで計算して迅速な再計画が可能
  • 短所: 構造が固定されており、事後的な計画に適用するのが困難です。反応的な障害物回避やその他の機能は、比較的高頻度の再計画によって実現できるように感じます。

元のラティスは最大ターン戦略に基づいていますが、後に速度係数を考慮した最大ターン戦略が追加されました。ただし、これら 2 つの方法によって提供される事前定義された一連の動作は、動的環境に適応することが困難であることが多く、目的の位置を達成するには高密度が必要です。その後、基準線と車線線に基づいて点を分散させる環境適応格子が登場しましたが、ドライバーの行動を統合する他の方法もありました。

Lattice は道路の境界と運動学的制約を考慮し、より迅速な再計画を実現できるため、高速道路計画に非常に役立ちます。ただし、各反復に必要なストレージ容量は計算量に影響します。

2) 経路探索アルゴリズム

  • 経路探索のようなアルゴリズムでは、通常、最適化のためにコスト関数が必要です。
  • これらのアルゴリズムは広く使用されており、既知の環​​境でも未知の環境でも使用できます。
  • 主な欠点: グラフのサイズと複雑さに依存します。空間構成に関する情報が必要であり、オープン シーンへの適応性が低いです。
  • 古典的なダイクストラ、AStar、その他のアルゴリズムの紹介は、 [モバイル ロボットの動作計画] 01 - 共通マップの基礎 | グラフ検索の基礎を参照してください。
  • ここに画像の説明を挿入します
  • ヒューリスティック関数の設計例:車線境界線からの距離と走行距離に基づいた設計、走行時間と危険運転に対する罰則に基づいた設計。
  • Anytime Weighted A * ( AWA *): ヒューリスティック関数に重みを付けて、計算時間を短縮します。
  • ハイブリッド状態 A *: 動的制約を考慮し、非ホロノミック制約に基づくヒューリスティック関数を使用するが障害物は考慮しない、および障害物に基づくヒューリスティック関数を使用するが非ホロノミック制約は考慮しない。
  • D *: ダイナミックなシーンに基づく
  • RRT は運動学的に実現可能なパスを生成でき、反応的な障害物回避パスの生成に使用できます。
  • RRT *: 漸近最適。短所: ランダム サンプリングではグラフの接続性が低下する可能性があり、再現が困難です。高速道路の場合、環境情報は通常比較的単純で分かりやすいため、決定論的な検索アルゴリズムを使用する方がよい場合があります。

3) 引力と斥力

  • 重力と斥力(場)に基づく方法の利点

    • ダイナミックなシーンにも対応可能
    • シーンの明示的なモデリングは必要ありません
  • このタイプの方法は通常、勾配降下法(車両モデルを考慮しない) またはニュートンの第 2 法則(車両モデルを考慮する)に基づいています。

  • すべての空間をモデル化することは難しいため、このタイプの方法は通常、動的な変化に応じて動きの軌道を調整するために使用されます。

  • ここに画像の説明を挿入します

  • 人工ポテンシャル場 (APF) : [99]; [100] 電場の考え方に基づき、APF は制御入力 [96] を直接生成するか、最適化問題に必要な制約を生成します [46]、[101]

  • 速度ベクトル場 (VVF) : 速度ベクトル場、より安定した動的軌道

  • 短所: 障害物に近すぎるとオーバーシュートが発生し、極小値に陥ってしまいます。極小値から飛び出すには、通常、ランダム ヒューリスティックが使用されます。ただし、高速道路計画では、時期尚早の車線変更を避けるために極小値が必要になる場合があります。

  • 仮想力場 (VFF) : ベクトル ヒストグラム法を使用し、仮想力として確率分布を使用します。

  • もう 1 つの欠点は、動的な障害物回避では空間次元のみが考慮されるため、障害物に直面した場合、通り過ぎる戦略が採用されることがよくあります。

  • elastic Band : 上記の状況に合わせてエラスティック バンド アルゴリズムが改善されました

このタイプのアルゴリズムは大量の計算を必要とする場合がありますが、高速道路計画ではより効果的です。

4) パラメトリック曲線とセミパラメトリック曲線

  • パラメトリック曲線とセミパラメトリック曲線が高速道路計画の幾何学的アルゴリズムの主流である理由は次のとおりです。

    • 高速道路自体は、一連の単純な事前定義されたカーブです。
    • 事前定義された曲線のコレクションは、候補テスト トレースとしてすぐに利用できます。
    • 運動学的制約を直接考慮できる
  • 幾何学的制約と動的制約は通常、別々に考慮されます。言い換えれば、経路計画と速度計画は分離されています [106]、[107]。デカップリングにより、車両は動的なシナリオに適応できるようになります。

  • 著者は主に 2 種類の曲線アルゴリズムについて説明します。

    • 曲線を直接使用して対応する候補軌道ライブラリを生成するには、さらに選択する必要があります。
      • 1 つ目のタイプのアルゴリズムは、通常、触手アルゴリズム[108] の原理を使用しており、空間分解法と比較して、計算空間と計算時間が大幅に短縮されます。
      • Dubins曲線: 曲線と直線の組み合わせ [110]。
      • [42]、[109]
      • ただし、このタイプの方法には曲線の曲率の 2 次導関数の不連続性があり、車両モデルへの適用が困難になります (最適化またはフィッティング方法で補正できます)。著者は、スパイラル曲線を使用して直線と円弧曲線を接続し、曲線の曲率の 2 次導関数の連続性を実現すると述べました。
      • クロソイド曲線の曲率は曲線の横座標に比例します [50]。この機能は、横方向の加速を制限し、快適性を制限するために使用できます。[111]、[112]、[113]。
      • クロソイド曲線は一定の反復を必要とするため、多くの計算時間がかかります。
      • シグモイドまたは S-Function
    • パスポイントに基づいて曲線軌道を生成する
      • ポイントベースの曲線生成は、環境制約や動的制約にうまく適応でき、平滑化ステップとしても使用できます。
      • [29]: 3 次スパイラル曲線
      • [80]: 速度の生成には 3 次関数が使用され、横方向および縦方向の軌道の生成には 4 次および 5 次の多項式が使用されます。
      • [81]: 3 次多項式関数と平滑化 4 次曲率多項式を使用してパスを生成し、3 次多項式を使用して速度を生成します。
      • より複雑な多項式補間計算に関する問題のために、セミパラメトリック スプライン曲線が改善されました。曲線は一連の区分的多項式として定義する必要があります。
      • ベジェ曲線: 変曲点として補間点ではなく制御点を使用するため事前定義された制御点に正確に従うわけではありません。実装は簡単で、計算もほとんど必要ありません。[49]、[116]、[117] は SVM を使用して制御ポイントを提供しました。
    • ここに画像の説明を挿入します
    • 概要: 曲線ベースのアルゴリズムは通常、他のアルゴリズムと組み合わせられ、曲線の選択は特定の問題と環境情報によって異なります。

5) 数値最適化

  • 最適化アルゴリズムは、組み合わせ爆発を回避するための競争的な組み合わせ操作研究の一部でもあります。
  • 著者は、動作計画における 2 つの最適化アルゴリズムの適用を紹介します。
    • 効率的な方法で検索時間を短縮しながら、複雑な問題を解決します。
    • 与えられた制約内で数学的手法を使用して問題を解決することも、この記事で説明する主な側面です。
  • 利点: 問題の制約を処理するのが簡単で、複数基準の最適化問題を処理でき、車両モデルの状態次元と運動学が考慮されます。
  • 線形計画法 (LP) : 線形計画法。[81]
  • Sequential LP (SLP) : 逐次線形計画法[119]
  • 非線形計画法 (NLP) : 非線形計画法; NLP は、パスの最適化で使用されるレーベンバーグ・マルカート アルゴリズム [29]、[104] や BVP 問題の解決 [33] など、非線形回帰問題の特殊な場合に使用されます。 。
    • Levenberg-Marquardt アルゴリズムは、曲線の近似や非線形最適化問題の解決によく使用される非線形最小二乗最適化アルゴリズムです。このアルゴリズムは、勾配降下法とガウス・ニュートン法の利点を組み合わせており、反復プロセス中にステップ サイズを適応的に調整でき、高速収束、効率性、安定性という特徴を備えています。カーブフィッティング、信号処理、機械学習などの分野で広く使用されています。

  • 二次計画法 (QP) : 二次計画法。
  • 逐次二次計画法 (SQP) : 逐次二次計画法。[18]
  • 混合整数二次計画法 (MIQP) :[120]、[121]
  • モデル予測制御 (MPC) : モデル予測制御 [46]、[47]、[51]、[113]、[118]、[122]、[123]。MPC は強力な再計画機能を備えていますが、非凸問題や複雑性の高い問題を解決するには不十分です。
  • 動的プログラミング (DP) : 動的プログラミングは、複雑な問題を解決します。[49]、[124]

6) 人工知能

  • AI アルゴリズムは強力な汎化機能を備えており、アルゴリズムの構造を変更せずに新たな調整を行うことができます。
  • 4種類のアルゴリズム:ヒューマノイド、ヒューリスティック、近似推論、ロジックここに画像の説明を挿入します
a) AIロジックベースのアプローチ
  • エキスパート システムは、特定の複雑なタスクを解決し、知識ベースと推論エンジンに依存して推論システムを自動化するように定義されています。

  • ロジックベースの AI アルゴリズムには、高速アーキテクチャという利点があり(よく理解されていません)、予測的または事後的な計画に使用できます。

  • 主な利点: 人間の論理と合理的な推論をシミュレートできる

  • 短所: 知識ベースでは、多数の因果関係ルールと調整パラメーターを使用して環境変数を離散化する必要があります。

  • ルールベース

    • [126] は高速道路でのルールベースの意図予測で満足のいく結果を達成し、[127] ではそれを車線変更操作に使用しました。
    • その主な利点は、因果関係を明確に特定できること、ラベル付けが便利であること、および実装が簡単であることです。
    • その主な欠点は、循環推論とルールの徹底的な列挙により、無限ループが発生し、計算時間に影響を与えることです。現在の状況がルール ベースの観察結果と一致しない場合、不適切な決定が行われる可能性があります。
    • ルールの順序も重要であり、ルールはヒューリスティックに順序付けできます
  • デシジョン ツリーデシジョン ツリー:

    • [78] 考えられるすべての走行車線を説明してください。
    • [32]、[128] では、二分決定図とフローチャートを使用してブール関数を表しています。
    • 不確実でおおよその状況を説明するのが難しい。ディシジョン ツリーでは、他の車両の危険で違法な行為、つまり法的要因も考慮する必要があります。
  • 有限状態マシン(FSM) 有限状態マシン:

    • [55] は緊急駐車に使用され、[129] は一連の動作と状態を経路生成と追跡制御にマッピングし、[18] は並列状態図を使用して同時状態を記述します。
    • 主な欠点は、それらが特定の知識にのみ基づいており、未知の状況に一般化できないことです。
    • ここに画像の説明を挿入します
  • ベイジアン ネットワークベイジアン ネットワーク:

    • 不確実性は許容してください。
    • ベイジアン ネットワークは、確率的変換に基づいた因果関係の統計的表現です。彼らは、出力シーケンス内で最も可能性の高い状態シーケンスを決定するための、知識ベースのパラメーター識別ステップを提案しました。
    • [27] 障害物の意図を比較し、自車の動作を戻す。
    • [50] は、触手軌道ライブラリ内の軌道を選択するために MDP を採用しました。[130] は車線維持と車線変更の決定に MDP を使用しました。
    • MDP の利点は、複数の予測情報を同時に評価できることです。
    • POMDP:[131]、[132]、[133]
  • 概要:

    • 人工知能ロジックに基づく方法は、制約があり予測可能な環境 (高速シナリオなど) に最も適しています。
    • 主な欠点は、自律性と厳密なプログラム構造が欠如していること、および適応性のある再構成可能なアルゴリズムを実装できないことです。
b) AIヒューリスティックアルゴリズム
  • ヒューリスティック アルゴリズムは経験に基づいており、自然環境プロセスの探索を容易にします。彼らの目標は、近似解を見つけて、従来の徹底的な手法が失敗した場合に、より高速で効率的なアルゴリズムとして使用できるようにすることです。
  • 通常、一連のアクションのコレクションを返します。
  • それらの主な利点は、計算時間が短いこと、複雑さが低いこと、および複雑な問題を処理する強力な能力であることです。
  • ただし、全体的な最適性精度は保証できません
  • エージェント: ヒューリスティック アルゴリズムには通常、エージェントの概念が含まれます。
    • ヒューリスティック エージェントの機能により、ターゲットまでの距離、車線選択バイアス、最大ヨー レート、ポリシー コストなど、[132] などの複数の戦略決定を含めることができます。
    • 不確実な環境に適応する
  • サポートベクターマシン(SVM)
    • [117] は SVM を使用してベジェ曲線の制御点を適合させ、[134] は車線変更の決定に適用されました。
  • 進化的手法
    • 進化的手法 進化的アルゴリズムは、生物学的シミュレーションにインスピレーションを得て広く使用されている学習アルゴリズムの一種であり、生殖、突然変異、組換え、選択などの自然で合理的な進化プロセスを持っていますまず、適合度関数に関連付けられた一連の事前解を特定して、その品質を評価する必要があります。次に、一連の進化プロセスを適用して、最適化問題に対するより良い解決策を見つけます。
    • [136] はファジー制御モジュールを改善するために 2 つの遺伝的アルゴリズムを適用し、[137] は速度、角度、中断および回避時間に基づく 4 染色体構造の遺伝的アルゴリズムを詳細に導入しました。
    • このアルゴリズムの安定性とリスクは突然変異メカニズムに関連しており、そのランダムなプロセスにより極小値が生じる可能性があります
c) AIによる近似推論
  • 論理的推論との違いは、知識ベースが非ブール値である、および将来の状況に適応するために新しい知識を分類する学習方法であることです。

  • ファジーロジック

    • ファジー ロジックは多値変数に依存しており、ファジーを数学的にモデル化し、認知的推論を近似できるブール トレードオフに基づくファジー エキスパート システムが含まれています。
    • 主な利点は、設計されたルールの柔軟性と許容性、および不確実なデータに対する拡張性です。
    • 主な欠点は、トレーサビリティの欠如と体系的な設計アプローチの欠如です。
    • [138] 障害物までの距離に基づいて車線変更のタイミングを決定する。[139] と [140] は、それぞれ横方向誤差と角度誤差のファジィ規則を使用した参照マップに基づいた自動追い越し操作と横方向追従を提案しました。
    • ここに画像の説明を挿入します
  • 人工ニューラルネットワーク (ANN)

    • ANN は意思決定とパス生成に応用できます。
    • 主な利点は、多次元データのトレーニングによって学習できることです。
    • 解決策の適切な因果関係の説明が不足している。
    • もう 1 つの欠点は、大量のデータが必要になるため、計算コストが高くつくことです。
    • [122] は、隠れマルコフ モデル( HMM )隠れマルコフ モデルと混合ガウス回帰を組み合わせた方法を採用しました。
    • [141] は、3 層の人工ニューラル ネットワーク上でレーベンバーグ マルカート アルゴリズムを使用して、運転速度を学習しました。
    • [142] は畳み込みニューラル ネットワークを使用してドライバーの車線変更の軌跡をシミュレートし、[143] は学習フェーズを人間のドライバーの制御入力と比較しました。
    • 強化学習は[ 133] でシーン表現における各エージェントの戦略を決定するために使用され、[144] と [145] はマルチターゲットの追い越しや自動車線変更操作で使用されます
    • ディープラーニング手法は [146] で検討され、[147] ではセンシングブロックとプランニングブロックをエンドツーエンド学習に統合しました。
    • [148] では、ベイジアン確率を使用してニューラル ネットワークを拡張し、不確実性の下で信念ネットワーク学習を実行します。
  • 概要:

    • 近似推論のための AI アルゴリズムは、認知特性にまで及ぶ論理的および統計的基盤に依存しています。また、環境に応じて適切に進化するための適応推論も提供します。複雑に変化する環境に対する優れた適応性と汎化能力。
    • これらのアルゴリズムの主な欠点は、実際の運転シナリオからのフィードバックが欠如していることです。
d) AI 人間のような手法
  • 主な利点は、意思決定プロセスの抽象的かつ普遍的な表現です。

  • しかし、正確にモデル化して使用するのは難しい

  • リスク、タスク、ゲームの3種類の手法

  • リスク推定者

    • リスク推定器は、認知バイアスのあるシナリオ分析において健全な意思決定を行うために使用されます。
    • 利点: 直感的。
    • 関連する評価指標:
      • 衝突までの時間 (TTC):[51]、[55]、[150];
      • 反応時間 (TTR):[151]、[152]
      • 迎撃時間 (TTI):[154]
    • バイナリ リスク推定量バイナリ リスク推定量は、シナリオの大まかな評価を提供しますが、障害物の将来の動きの不確実性は無視できないパラメータです。
    • 確率的リスク推定ツール確率的リスク推定ツールは、シナリオをより現実的に表現するのに適しています。
    • 補償リスク
      • 補償リスク: ドライバーのリスク認識に適応するために、補償リスク推定ツールはストレス、眠気、病気などのドライバーの状態を導入します。タイム オブ ゾーン クリアランス(TZC) は [157] で導入されました。
  • タスク分類モデル

    • 彼らは、行動と能力の要件を通じて、シーケンス主導のタスクの関係を特定します。

    • 一連のタスクで構成されていますここに画像の説明を挿入します

    • 欠点の 1 つは、車線変更や合流などの運転タスクに焦点を当てているか、網羅的であることが難しいため、明示的に説明するのが難しいことです。

  • ゲーム理論 ゲーム理論:

    • このアプローチの主な利点は、トレーニングされたドライバー モデルを迅速に取得できることです。
    • 欠点、すべての参加者がルールに従うことを前提としていますが、現実世界の状況における変動の一部が考慮されていないことです。
    • [133] では、モデルは他の行動でトレーニングされると、より複雑なポリシーを開発します。著者らは、POMDP を使用して、トレーニング段階でのトラフィック参加者の知識と Jaakola 強化学習をモデル化します

IV. 高速道路用途の比較表

表は以前のアルゴリズムをまとめたものです。

表 2 運動計画手法の高速道路への適用の比較表 (「−−」は非常に不適切、「−」は不適切、「〜」は中間、「+」は適切、「++」は非常に適切)。

ここに画像の説明を挿入します

V. 今後の研究の方向性

A. データ管理

  • 参考文献 [166] では動作計画に影響を与えるいくつかの知覚上の課題について詳しく説明し、参考文献 [167] では運転制御アルゴリズムを改善するための条件について説明しています。
  • 著者はこのパートで 2 つの問題に焦点を当てています。
    • 不確実性と信頼性の観点から、どれだけのデータがあれば十分ですか? 不確実性と信頼性の観点から、どのくらいのデータがあれば十分ですか?
    • 遅延した非同期データについてどのように意思決定を行うのでしょうか? レイテンシーと非同期データを考慮してどのように意思決定を行うのでしょうか?

1) データの不確実性と信頼性

  • データの不確実性と信頼性に関連するアルゴリズム:
    • カルマン推定量カルマン推定量[52]、[169]
    • マルコフ過程 マルコフ過程[131]、[170]
    • モンテカルロ法マルコフプロセス[131]、[170]
    • 証拠理論[52]
    • 間隔アルゴリズム 間隔演算[171]
  • さらに、計画段階では、データが失われた場合でも車両の安全を確保するために移動の継続性を確保する必要があります。

2) データの同期

  • シーンのデータはさまざまな周波数と遅延取得されます
  • 最初の解決策は、動作計画モジュールとコントローラーに対して同じタイム ステップでアルゴリズムを実行し、最後に取得したデータを外挿することです。
  • 2 番目のアプローチは、新しいデータが到着するたびに更新されるプランナーに基づいています。その後、ハイブリッド ロジックが固定周波数で実行され、新しいデータが到着するとデータが更新され、データ セットを外挿することで伝播方程式が改善されます。

B. 適応型モビリティ

  • 人間のドライバーがロボットのドライバーと対峙する際に考慮する必要がある、敬意、受容性、予測可能性、快適さなどの安全上の問題を指摘しています。

1) 安全性

  • セキュリティ上の理由から、永続的な危険と一時的な危険を区別するのに十分賢いアルゴリズムが必要です
  • 自動運転における縦方向の距離と速度の制御は通常、人間の運転よりも速いため、縦方向の安全空間が小さくなる可能性があります
  • それに比べて、人間のドライバーの横方向の距離制御は通常より安定しているため、自動運転の横方向の安全空間はより大きくなければなりません。
  • さらに、この安全スペースは、環境内での事故(前方車両の予期せぬブレーキ、予期せぬ行き止まりなど)に対処するのに十分なものでなければなりません。
  • 人間の乗っ取りと自動運転車の人間と機械のハイブリッド運転に関連する問題 :
    • 最初の課題は、ドライバーがコントロールを取り戻した状況でも、安定した予測可能な意思決定を維持することです。
    • 2 つ目は、人間のドライバーと機械の決定が互いに矛盾する可能性があることです[177]。
    • 人間のドライバーが自動運転に直面する際に考慮する必要がある安全性の問題には、敬意、受容性、予測可能性、快適さなどの側面が含まれます。

2)エコドライブ計画

  • エコドライブは、省エネと低炭素の目標を達成するため、エネルギー効率と環境保護に基づくコスト関数を備えた多基準最適化問題 (III-B5 を参照) として表現されます。考慮すべき主な側面は 2 つあります。
  • まず、自動運転車のダイナミクスモデルを解析し、燃料消費量を削減するための低加速・定速走行などのスムーズな走行方法を提案した。
  • 第二に、突然の行動を避けるために、適切な予測と期待を持ちます。

3) 知覚補償

  • 知覚に関する問題の 1 つは、運転シーンの視点が固定されているという制約です。
  • しかし、人間のドライバーが意思決定をしなければならないとき、ドライバーは車両を移動させてより広い知覚環境でより多くの情報を得ることで知覚を最適化します。

4) ルートコンテキスト

  • グローバル パス プランニングは、実際には、ローカル パス プランニングに対応する制約を作成します。たとえば、高速道路の右側出口では、自車が右端の車線へナビゲーションする必要があります。

5) サービス指向

  • さまざまな車両の使用に応じて、意思決定の動作はサービスの属性に基づいて調整されます。
  • これまでの古典的なアプローチは、時空間領域での意思決定、つまり車両がいつどこで移動しなければならないかを決定するものでした。車両のナビゲーション方法という 3 番目の次元が追加されました

C. 協力計画

  • 個人

    • 各車両は他の車両とは独立して決定を下しますが、相互作用 [159] や礼儀正しさ [184] などの要素が考慮されます。
  • 一括

    • 群知能: 群知能
    • この集団的な意思決定には、他の車両の状態に関する知識と強力なコミュニケーションが必要です。群れインテリジェンス、イベント駆動型手法、リスク推定、およびファジー ロジック モデリングを通じて、車両が連携して編隊操縦を実現できるようになります。同時に、スマート インフラストラクチャは、調整されたスケジューラを通じて車両の動作の予測と監視を実現するマネージャーまたはコントローラーとしても機能します。文献では主に知識推論エンジンとエージェントに基づくスマート ハイウェイ マネージャーが紹介されています。
  • 共有:

    • 自動運転技術が人間のドライバーとどのように連携し、意思決定を共有するか。SAE 自動化レベルは、ドライバーと自動運転車の間の共有協力を表します。ドライバーの経験は自動運転システムに役立ち、ファジィ化手法を使用してそれをシステムの決定と組み合わせることができます。この研究では、自動運転技術をより効果的に促進するために、自動運転車の動作をドライバーのタイプに適応させる方法も検討しています。

D. 検証と評価

1) 遷移の安定性

  • 「遷移の安定性」とは、遷移の安定性、つまり、異なる動作計画アルゴリズムを使用した場合にシステム間の遷移が安定、信頼性、堅牢であるかどうかを指します。移行が不安定な場合は、決定、アクション、観察の一貫性を検証するために高レベルのスーパーバイザーを追加する必要があります。
  • [195] で著者らは、手動運転と自動運転、および異なる操縦モード間を切り替えることができるアーキテクチャを実装した、FSM の意思決定に似た行動モデルを提案しました。

2) 評価

  • これには主に、人間によるドライバーの評価 (安全性、スムーズさ、運転時間) と、シミュレーションおよび実験テストでの重要業績評価指標 (KPI) の使用が含まれます。

3) 倫理

  • ロボットシステムが人間と対話する場合、倫理的および道徳的問題を考慮する必要があります。関連する研究では、ハイブリッド合理性と人工知能に基づいて倫理を展開する戦略や、意思決定に倫理を組み込む方法が提案されています。

4) アルゴリズム緩和

  • 自動運転車の安全性を確保するには、運転ルールの厳格な遵守と緩和が鍵となります。実際、重大な状況では、厳しい制約であっても危険になる可能性があります [13]。

おすすめ

転載: blog.csdn.net/sinat_52032317/article/details/133189127