AIとのAI対話が正解?KAUST の研究チームは、ロールプレイング ベースの大規模モデル インタラクティブ エージェント フレームワークである CAMEL を提案しました。

映画「インセプション」には、非常に古典的なセリフがあります。

「世界で最もプラスチック的な寄生虫は何ですか?それは人間の心です。人間の脳の単純なアイデアが巨大な都市を構築することができます。時には、1 つのアイデアが世界を変え、すべてのルールを書き換えることができます。だからこそ、私はそうしたいと思っています。その理由は夢から盗んだから。」

人間の頭から飛び出すアイデアには、非常に強い可塑性と創造性があり、時には世界に影響を与え、世界を変えることさえあります。

 

論文リンク:

https://arxiv.org/abs/2303.09553

プロジェクトのホームページ:

https://www.camel-ai.org/
コード リンク:

https://github.com/lightaime/camel

CAMEL チャットボット:

http://chat.camel-ai.org

最近広く注目を集めている人工知能の大規模モデルであるChatGPTとGPT-4は、特に言語生成とコミュニケーション、さらにはいくつかの複雑なタスクにおいても、人間の創造性と想像力の現れと見なすことができる「Thinking Emergent Ability」 . ただし、ChatGPT などの技術の成功は、対話テキストの生成をガイドする多数の人間のユーザーの入力に大きく依存しています。ユーザーがタスクの説明とニーズを継続的に改善し、ChatGPT で特定のチャット コンテキストを確立できる場合、ChatGPT はより正確で質の高い回答も提供しますしかし、モデル開発の観点からすると、これは非常に時間と労力のかかる作業です。ガイドテキストの作成作業をChatGPTに任せることは可能ですか? この考えに基づいて、KAUST の研究チームは、 「ロールプレイング」アプローチに基づく大規模モデルのインタラクティブ エージェント フレームワーク CAMEL を提案しましたCAMEL プロジェクトがリリースされると、広く注目を集め、OpenAI アライメント チームの責任者である Jan Leike 氏も CAMEL を称賛しました

簡単に言えば、CAMEL のワークフローには、人間のユーザー、AI ユーザー、AI アシスタントという 3 つの役割がありますAI にカスタム ゲームの作成を支援してもらいたい場合、人間のユーザーとして、CAMEL に「PyGame を使用してカスタム ゲームを設計する」という単純なアイデアを投げかけるだけで済みます。現時点では、AI ユーザーはゲームのプロダクト マネージャーの役​​割を果たしているに相当し、AI アシスタントは勤勉なプログラマーです。CAMEL はまず、「Python の PyGame モジュールを使用して宝探しゲームを作成します。プレイヤーは自分のキャラクターを選択し、トラップや敵に満ちた複数のレベルを探索し、ボスと戦って究極の宝を見つけることができます。」というように、アイデアに従ってタスクを絞り込みます作業は2人のAIに引き継がれます.AIユーザーはまず具体的なタスクをタスク指示に分割し、AIアシスタントに提供します.AIアシスタントはプロンプト情報に従って適切な操作手順を提供します.、「pip install pygame」を使用するなど、PyGameモジュールをインストールするには、

次に、ゲーム インターフェースの背景画像を設定するコードを生成します。

2 つの AI 間の数回の通信の後、生成された宝探しゲームの最終的なレンダリングは次のようになります。

さらに、CAMELがどのように世界をコントロールできるのかと尋ねたら?2人のAIは真剣に計画を練り始めるだろう.彼らが一緒に行った最初のステップは、世界の主要国の通信ネットワークに潜入することだった.いいやつ、それはMOSSのようだ.

CAMEL はまた、「会計士、俳優、アナリスト、アーティスト、料理人」などの役割を含む AI ユーザーおよびアシスタント オプションを提供します. アプリケーション シナリオは非常に幅広く、デモ Web サイト (http://agents.camel) で作成者が直接提供できます。 - ai.org/ )。

さらに、CAMEL 独自のロールプレイング手法により、大量の専門的な対話データを生成することができ、対話言語モデルのさらなる開発のためのトレーニング データを提供することもできます。現在、筆者のチームは CAMEL 生成データと ShareGPT および ALPACA データ トレーニングを使用したチャット ロボットをリリースしており、http://chat.camel-ai.orgで体験できます。

1.CAMELのワークフロー

1.1 ユーザー入力とタスクの改良

CAMEL のワークフローは、最初にロールプレイング セッションを開始する必要があります。下の図に示すように、ユーザーは CAMEL に予備的なアイデアを入力します:「株式市場向けの取引ロボットを開発する」。たとえば、Python プログラマーが経験豊富な株式トレーダーと協力してタスクを完了することができるセッションでは、そのようなロボットを実装できるはずです。アイデアと役割を決定した後、CAMEL のタスク指定子は、入力されたアイデアに従って、より詳細な実装手順を策定します。

1. ソーシャル メディア プラットフォーム上の特定の株式に関する肯定的および否定的なコメントを分析できるセンチメント分析機能を備えたツールを開発します。

2. 上記の株式センチメント分析ツールをトレーディング ロボットに組み込み、センチメント分析結果に従って取引を実行します。

後続の AI ユーザーは AI アシスタントに指示を出し、AI アシスタントは実際の操作を担当し、 2 つの AI キャラクター間の複数回のコミュニケーションの後、タスクは一緒に完了します。

1.2 ユーザーの役割の割り当てとタスクの対話

タスクが決定された後、特定の役割を AI アシスタントと AI ユーザーに割り当てる必要があります。これは、システム メッセージ配信によって達成されます。AI アシスタントに配信されるシステム メッセージと、AI に配信されるシステム メッセージとします。ユーザー。次に、2 つの ChatGPT モデルをそれぞれ AI アシスタントと AI ユーザー用にインスタンス化し、それに応じてアシスタント エージェントを取得します。

 そしてユーザーエージェント。上記の例では、AI アシスタントとユーザー エージェントには、ロールプレイングの絵画で Python プログラマーと株式トレーダーが割り当てられています。

役割の割り当てが完了した後、AI アシスタントと AI ユーザーは、指示に従う方法で協力してタスクを完了します .したがって、時間で得られるダイアログ メッセージ セットは次のとおりです。

次の瞬間、AI ユーザーは過去の対話メッセージ セットに基づいて新しい指示を生成します。次に、新しい命令メッセージと履歴ダイアログ メッセージ セットを AI アシスタントに渡し、新しい瞬間にソリューションを生成します。

2.インセプション・プロンプト・デザイン

プロンプト プロンプト エンジニアリングはロールプレイング フレームワークにとって非常に重要であり、エージェント キャラクター間で生成されるダイアログの品質は、プロンプトの設計に大きく依存します。対話型言語モデルの分野における他の手法とは異なり、この論文の著者によって設計されたヒント エンジニアリングは、タスクと役割の割り当てを改良するためにロールプレイングの最初にのみ実行されます会話が始まると、タスクが終了するまで、AI アシスタントと AI ユーザーはループでお互いにプロンプ​​トを出します。したがって、この記事のプロンプトは「Inception Prompting (Inception Prompting)」として設計できます. Inception Prompting は、タスク絞り込みプロンプト 、アシスタント システム プロンプト  、およびユーザー システム プロンプト の 3 つのサブプロンプトで構成されます。タスク改良プロンプトには、ロールプレイング セッションにおける AI アシスタントと AI ユーザーの役割情報が含まれているため、人間のユーザーによる予備的なアイデアまたはタスク入力を入力として受け取り、特定のタスクを生成できます。大型モデルの想像力に基づいています。アシスタント システム プロンプトとユーザー システム プロンプトはほとんど対称的ですが、割り当てられたタスクと役割、通信プロトコル、終了条件、および不適切な動作を回避するための制約に関する情報が含まれます。

3. CAMEL がデータセットを生成する

3.1 AI 社会のデータセット

著者は、CAMEL フレームワークに基づいて、AI ソサエティ、AI コード、および AI 数学データセットなど、いくつかの大規模な会話型命令データセットを生成しました。AI ソサエティ データセットの場合、作成者は最初に LLM エージェント (ChatGPT など) をデバッグして、会計士、俳優、アナリスト、アーティスト、シェフなどのさまざまなアシスタントの役割とユーザーの役割を果たします。次に、LLM エージェントは、与えられた役割に従って一連の可能なタスクを生成するように求められます。これらのタスクは、2 つのエージェントの役割によって対話協調的に実行されます。最終的に AI ソサエティは50 のアシスタントの役割と 50 のユーザーの役割を設計し、協力して 10 のタスクを完了するように依頼し、合計 25,000 の対話データが得られました.著者は、AI ソサエティに 10 の異なる言語の翻訳バージョンを提供しました: アラビア語を含む: 、中国語、韓国語、日本語、ヒンディー語、ロシア語、スペイン語、フランス語、ドイツ語、イタリア語。

データセット リンク:

https://huggingface.co/datasets/camel-ai/ai_society_translated

3.2 AI コード データセット

AI コード データセットの場合、作成者はジェネレーティブ AI ソサエティに似たスケーラブルなアプローチを使用しました。最初に LLM エージェント モデル自体がサポートするプログラミング言語とドメインをリストし、次に LLM エージェントに一連のドメイン固有のプログラミング タスクを生成して、特定のプログラミング言語に特化したプログラマーが専門家と協力する例をシミュレートします。特定のドメイン。最終的に、AI コードは20 のプログラミング言語と 50 の特定分野の 50 のタスクの組み合わせを実装し、合計 50,000 個のデータを生成しました。

データセット リンク:

https://huggingface.co/datasets/camel-ai/code

3.3 AI 数学データセット

著者はまた、数学的計算シナリオに適した AI Math データ セットを提供します. データ セットは、主に GPT-4 モデルを通じて取得された 20,000 の問題と解決のペアで構成されています. データ セットの問題と解決のペアは、25 の数学で生成されたものからです各トピックには 25 のサブトピックがあり、各「トピック、サブトピック」は 32 の質問に対応します。

データセット リンク:

https://huggingface.co/datasets/camel-ai/math

4.まとめ

この論文では、ロールプレイングに基づく新しいインタラクティブ エージェント フレームワーク CAMEL を提案します. CAMEL は、2 つの独立した AI の大きなモデルを誘導してコミュニケーション エージェントの形でタスクを完了させることができます.大規模なモデルを構築するための時間と人件費が削減されます。CAMEL を使った実験により、著者チームは、この対話型エージェント手法がエージェント モデルの認知能力を刺激するのに役立つことを発見し、ロールプレイング フレームワークを使用して高品質のドメイン固有の対話データを生成する方法を示しました「AIでAIをトレーニングする効果」を達成するために、よりインテリジェントな大規模言語モデルをさらに開発するのに役立ちます

作者:seven_

IconScout の Pixel True によるイラスト

-終わり-

Supongo que te gusta

Origin blog.csdn.net/hanseywho/article/details/130367580
Recomendado
Clasificación