MIT による新たな進歩! 人工知能がロボットの総合制御技術を支援

原文 | 文:BFT Robot 

写真

MITの研究者らは、ロボットが指先だけではなく手全体を使って物体を操作するための複雑な計画を立てることを可能にする人工知能技術を開発した。このモデルは、標準的なノートを使用して、約 1 分で効果的な計画を作成できます。上の写真は、バケットを 180 度回転させようとしているロボットを示しています。

大きくて重い箱を階段で運びたいと想像してください。指を広げて両手で箱を持ち上げ、胸の近くの前腕でバランスをとり、体全体を使って箱を操作します。人間は一般に全体的な操作が得意ですが、ロボットはこの作業に困難を感じることがよくあります。ロボットにとって、ボックスがハンドラーの指、腕、胴体と接触する可能性のあるあらゆる点は、考慮する必要がある接触イベントを表します。潜在的な暴露事象の数が膨大であるため、計画という作業はすぐに手に負えなくなります。

今回、MIT の研究者らは、接触リッチ操作計画と呼ばれる、このプロセスを簡素化する方法を発見しました。彼らは、「スムージング」と呼ばれる人工知能技術を使用して、多くの接触イベントを少数の決定に要約し、単純なアルゴリズムでもロボットの効果的な制御計画を迅速に特定できるようにしました。

まだ初期段階ではあるが、このアプローチは工場で、指先だけで掴むことしかできない大型のロボットアームではなく、腕や体全体を使って物体を操作できる小型の移動ロボットの使用を可能にする可能性がある。消費を抑え、コストを削減します。さらに、この技術は、搭載されたコンピュータだけを頼りに環境に素早く適応できるため、火星や他の太陽系天体への遠征ミッションでも役立つ可能性がある。

「この種のロボット システムをブラック ボックス システムとして扱うのではなく、その構造を活用できれば、これらの決定を下し、連絡先強化計画を策定しようとするプロセス全体をスピードアップする機会が得られます。」と電気工学とコンピュータの分野では述べられています。科学(EECS)の大学院生であり、この技術の共同主著者の一人である H.J. Terry Suh 氏は語った。この論文の執筆にスー氏とともに協力したのは、ボストン・ダイナミクス人工知能研究所のロボット工学者で博士課程の学生である共同主著者のタオ・パン氏、電気工学とコンピュータサイエンスの大学院生であるルジエ・ヤン氏、そして主著者であるトヨタ自動車教授のラス・テドレイク氏である。電気工学およびコンピューター サイエンス、航空宇宙学、機械工学を専攻し、コンピューター サイエンスおよび人工知能研究所 (CSAIL) のメンバー。この研究は今週、IEEE Transactions on Robotics誌に掲載される。

強化機械学習 

強化学習は、エージェント (ロボットなど) が試行錯誤を通じてタスクを完了することを学習し、目標に近づくたびに報酬を受け取る機械学習手法です。研究者らは、システムは試行錯誤を通じて世界に関するすべてを学習する必要があるため、この種の学習はブラックボックスアプローチをとると述べています。

強化学習は、ロボットが指定された方法で物体を動かすための最適な方法を学習しようとする、接触の多い操作計画に効果的に使用されています。

写真

これらの図では、シミュレートされたロボットが、手に持ったボールを操作する、皿を拾う、ペンを特定の方向に調整するという 3 つの接触が多い操作タスクを実行します。

しかし、ロボットが指、手、腕、体を使って物体と対話する方法を決定する際に、ロボットが推論する潜在的なタッチ ポイントが数十億あるため、この試行錯誤のアプローチは計算量が多くなります。一方、研究者がシステムに関する知識やロボットに達成させたいタスクを活用する物理ベースのモデルを具体的に設計した場合、そのモデルには世界に関する構造が組み込まれ、より効率的になります。

ただし、物理ベースの手法は、豊富な操作計画を実行する場合には強化学習ほど効果的ではありません。研究者らは詳細な分析を実施し、「平滑化」と呼ばれる手法により強化学習のパフォーマンスが向上することを発見しました。ロボットはオブジェクトの操作方法を決定する際に多くの決定を下す可能性がありますが、それらは一般に重要ではありません。たとえば、物体に接触しているかどうかにかかわらず、指のあらゆる小さな調整は重要ではなく、平滑化によって多くの重要でない中間の決定が平均化され、少数の重要な決定だけが残ります。

強化学習は、多くの接触点を試し、結果の加重平均を計算することで暗黙的に滑らかになります。この洞察に基づいて、MIT の研究者は、同様のタイプの平滑化操作を実行する単純なモデルを設計しました。これにより、コアのロボットとオブジェクトの相互作用に焦点を当て、長期的な動作を予測できるようになります。彼らは、このアプローチが複雑な計画を生成する際に強化学習と同じくらい効果的である可能性があることを示しました。

勝利の組み合わせ

平滑化により意思決定は大幅に簡素化されますが、残りの決定を検索することは依然として困難な問題となる可能性があります。そこで研究者らは、ロボットが行う可能性のあるすべての意思決定を迅速かつ効率的に検索できるアルゴリズムとモデルを組み合わせました。この組み合わせにより、計算時間は標準的なラップトップで約 1 分に短縮されます。

彼らはまずシミュレーションでその方法をテストし、ロボットハンドにペンを希望の形状に動かす、ドアを開ける、皿を持ち上げるなどのタスクを割り当てました。どの事例においても、彼らのモデルベースのアプローチは強化学習と同じパフォーマンスを、ほんの少しの時間で達成しました。実際のロボット アーム上のハードウェアでモデルをテストしたときにも、同様の結果が得られました。

写真

IiwaBimanualでセットアップしたハードウェアですが、目標はバレルを180度回転させることです。左側と右側の図は、それぞれ、開ループ プランが実行される前の初期状態と最終状態に対応します。モーション キャプチャ マーカー間に接続された線は、銃身の姿勢の変化を示しています。

「全体的な操作を可能にする同じアイデアが、器用な人間のような手の計画にも当てはまります。」とテドレイク氏は述べています。これまで、ほとんどの研究者は、器用な手に適用できる唯一の方法は強化学習であると考えていましたが、テリーとタオは、次のことから始めることによって、それを示しました。強化学習に(確率的)平滑化という重要なアイデアを採用することで、従来の計画手法を非常に効果的にすることもできます。」

ただし、彼らが開発したモデルは現実世界のより単純な近似に依存しているため、落下する物体のような非常に動的な動きを扱うことができません。彼らのアプローチは、低速の操作タスクには効果的でしたが、たとえばロボットが缶をゴミ箱に投げ込むことを可能にする計画を作成することはできませんでした。研究者らは将来的に、これらの非常にダイナミックな動きを処理するための技術を向上させる予定です。

著者 | LJH

植字 | Xiaohe

レビュー | 猫

この記事の内容についてご質問がございましたら、お問い合わせいただければ迅速に対応させていただきます。もっと最先端の情報を知りたい方は、ぜひ「いいね!」と「フォロー」を忘れずに!

おすすめ

転載: blog.csdn.net/Hinyeung2021/article/details/133040734