泡泡一分钟:繰り返しタスク実行を通じて不確実な環境での動作計画の方針を学びます

张宁繰り返しタスク実行を通じて不確実な環境での動作計画の方針を学びます

不確実な環境学習実行するための動作計画戦略反復作業によって
します。https://pan.baidu.com/s/1TlSJn0fXuKEwZ9vts4xA6gリンクを
抽出コード:jwsdは、
ああ、このオープンBaiduのネットワークディスク電話アプリケーションの内容をコピーし、操作がより便利に

フィレンツェ・ツァン、ライアンA.マクドナルド、そしてスティーブン・L.スミス

目標の場所に最初から不確実な環境をナビゲートする機能は多くのアプリケーションで必要です。オンライン再計画のための多くの反応性アルゴリズムがありますが、将来の実行を改善するために、同じナビゲーションタスクの過去の実行を活用する多くの研究がなされていませんでした。本研究では、最初に学ぶリアクティブプランニング問題(LRPP)を導入することによって、この問題を形式化Fiを提供しています。第二に、我々はこれらの過去の実行をキャプチャし、それから、ロボットが前に見たことの障害物を処理するための運動方針を決定する方法を提案します。第三に、我々は、このポリシーを使用すると、Fi回線cantlyだけで反応するアルゴリズムを使用した上で実行コストを削減することができますsigni我々の実験から示されています。

多くのアプリケーションでは、不確実な環境をナビゲートするために最初から位置を標的とする能力が必要とされます。そこにオンライン再計画のための多くの反応アルゴリズムがありますが、過去に多くの研究せず、将来の実装を改善するために、同じナビゲーションタスクで実行。が、この作品では、この問題を形式化するために計画問題(LRPP)を学習することによって、私たちの最初の反応が導入されます。第二に、我々はこれらの過去の実行をキャプチャする、と前に見robot'veの動きの障害に対処するための戦略を決定するための方法を提案します。第三に、我々は実験から見ることができ、この戦略は大幅いうだけで反応するアルゴリズムよりも、実装コストを削減することができます。

 

おすすめ

転載: www.cnblogs.com/feifanrensheng/p/11519225.html