あなたが言うなら、PC がやってくれるのです。Real Intelligence は、業界初の大規模モデルベースの TARS-RPA-Agent 製品を発売しました

2023年初頭、世界中で普及しているChatGPTがAIGC元年を迎え、国内外の様々なテクノロジー企業が大型モデルを続々とリリースしました。AI業界の準ユニコーン企業であるIntelligence Indeedは6月下旬、自社開発の垂直大規模言語モデル「TARS」の内部テストを開始した。

これに先立ち、リアル インテリジェンスは、早ければ 2022 年 12 月に、大規模なコンピューター ビジョン モデルに基づく「インテリジェント スクリーン セマンティック 理解」テクノロジー (ISSUT) を開拓し、RPA を従来の「ドラッグ アンド アンド ソリューション」から変革する「リアル IPA」モデルをリリースしました。 「ドロップ」エキスパート このモードは、簡単な「クリックして選択」Xiaobi モードに進化し、誰でも RPA を利用できるようになります。

時計の針を 2023 年下半期に戻すと、「実際のビジネス シナリオで大規模モデルを迅速かつ効果的に実装する方法」が、テクノロジー界と業界界が最も懸念している主要な問題となっています。リアルスマートは8月16日、第7回新製品発表会を開催し、この疑問に対する本当の答えを手渡した。

会議では、リアル インテリジェンスは「TARS (TARS)」大規模モデルを正式にリリースし、業界初の大規模モデルベースの TARS-RPA-Agent 製品を発売しました。これにより、デジタル従業員の適用敷居をさらに大幅に下げ、実現しました。 「言ったとおりの結果が得られます。言えば、PC がやってくれます!」

以下では、編集者があなたを TARS の世界に導き、乾物でいっぱいのエキサイティングなテクノロジーの饗宴をレビューします。

大規模なモデルは、RPA の新しい領域を切り開きます。デジタル従業員が対話形式で生成され、独立して仕事を完了できます。

Shizhi Intelligent の創設者兼 CEO である Sun Linjun (A Bao) 氏は、冒頭のスピーチで、大規模モデルの時代において、デジタル従業員の究極の形がますます明確になってきていると述べました。「大規模モデルと RPA の緊密な統合により、 」今回のカンファレンスで発表された「TARS-RPA-Agent」は、コンピュータビジョンと大規模言語モデルを組み合わせた業界初のインテリジェントボディ製品であり、RPA業界の発展におけるマイルストーンとなると考えられている。

同時に、過去 5 年間の技術の反復と製品革新を振り返り、「Shizhi Smart は 50 を超える発明特許と 300 を超える知的財産権を持っています。これは、当社が技術と製品の分野で良い仕事をしている証拠です。」プラットフォームベースのテクノロジー企業として、Real Smart は製品テクノロジーを継続的に反復し、標準化された製品とソリューションを通じてさまざまな業界の顧客と環境パートナーに力を与え、顧客が最適に認識する配信およびサービス システムを構築することに取り組んでいます。

本当にスマートな新技術ベース: TARS ラージモデル

クローズドベータ開始から45日後、Real Smartのパートナーでコアアルゴリズム部門の責任者であるOuyang Xiaogang (Xinyi)とアルゴリズム専門家のWang Dongyao (Kratos)が共同で「TARS」の謎を明らかにした。大型モデル。

AIGC時代の到来に伴い、リアルインテリジェンスは「TARS大型言語モデル(一般的な基本モデル、各種垂直産業モデル)+ISSUT(スマートスクリーン意味理解)マシンビジョン大型モデル」とその両者の間の技術基盤を再構築しました。インターネット上では、超自動化された製品マトリックスがアップグレードおよび変革され、革新的なアプリケーションが継続的にリリースされました。

記者会見では、TARS 大型モデルは、テキスト生成、言語理解、知識質問応答、論理的推論などの優れた主流機能を実証しました。

その中で、TARS-Finance-7B は、Xiangcai Securities と共同で構築された「自社開発、効果的、安全、信頼性があり、実装可能な」金融業界の大規模モデルであり、大規模モデルを生成する一般的なスキルを保持しているだけでなく、 、金融経済の分野でも強力な基盤を持っています。大幅に強化および改善され、複数の中国語と英語の一般ベンチマーク評価セットおよび金融ベンチマーク評価セットで良好な結果を達成しました。

金融と経済の分野では、60 億から 70 億のパラメータを持つベースライン モデルと比較して、TARS-Finance-7B モデルの平均タスク スコアは 1% ~ 20% 優れています。

一般的な分野では、TARS-Finance-7B は、ベース モデルおよび同じサイズの他のベースライン モデルと同等であり、一部の分野では先行しています。

優れた評価結果の裏には、4 か月に及ぶ実際の作業がありました。

十分かつ詳細なコーパス収集とクリーニング、データ処理とラベル付け、1,000 億を超えるトークンの事前トレーニング コーパス、および 100 万を超える命令微調整データに基づいて、事前トレーニング、命令微調整をインテリジェントかつ独立して完全に再現します。大規模モデル構築の強化と人間によるフィードバック 大規模モデルを完全に機能させるための 3 段階の学習 (RLHF)

中国語での不適切な音声の生成を識別して停止するための Detoxify システムを独自に開発し、モデルの安全性と無害性を向上させ、大型モデルを「賢明かつ法律を意識した」ものにしました

ランディングしやすい大型モデルの方が良いです。「制御可能なコスト、利用可能な効果、カスタマイズされたトレーニング、および民営化された展開」は、実際のシナリオにおける TARS 大規模モデルの商用実装の重要な特徴です。

大規模モデルの移植性と使いやすさを解決するという点で、Real Intelligence はまた、モデルの定量化による推論段階でのハードウェア リソースの消費の削減や、推論高速化ツールや推論加速ツールによる Q&A インタラクティブな製品エクスペリエンスの最適化など、多くの革新を行ってきました。テクノロジー。さらに、TARS ラージ モデルは実際のチャットボット製品とのシームレスなドッキングをサポートしており、ラージ モデルの機能を「ワンクリック構成」を通じて Web ページ、アプリ、アプレットなどのさまざまな端末に簡単に展開できます。

大型モデルを「見える・動く」にする:業界初のTARS-RPA-Agent

Shizhi はハイパーオートメーションの分野に参入して以来、AI テクノロジーと RPA 製品を継続的に深く統合し、革新的なアプリケーションを推進し続けています。業界で「統合ピッキング」テクノロジーの先駆者となり、トップレベルのピッキングと CV ピッキングのシームレスな統合をサポートし、従来の RPA の「ドラッグ アンド ドロップ」エキスパート モードを安定してスムーズに実行できるようにし、さらに「インテリジェント スクリーン セマンティック」の先駆者となりました。 「Understanding」テクノロジー (ISSUT) は、実際の IPA を通じて携帯電話、タブレットなどの画面の理解をサポートし、「クリックして選択」Xiaobai モードを作成します。

大規模モデルの時代が始まって以来、リアル インテリジェンスは大規模モデルと RPA 製品を組み合わせ、テキスト コマンドやチャットを通じてデジタル従業員を直接生成し、PC を操作して自律的に業務を完了する方法を考えてきました。そこで、本物のIPAの「初心者モード」をベースに、RPA利用の敷居をさらに下げ、そのまま「言った通りの、PCがやってくれる」という「バカモード」に突入する。

継続的な探索と実験を経て、Real Intelligence は業界初の大規模モデルに基づくエージェント製品、つまり TARS-RPA-Agent を発売しました。これは、「TARS+ISSUT」に基づくデュアルモード エンジンであり、「頭脳」を備えています。 「そして「目と手と足」。」 超自動化されたエージェント。同時に、タスクを独立して分解し、現在の環境を認識し、実行してフィードバックを提供し、過去の経験を記憶することができる新しい RPA モデルでもあります。
記者会見で、Ouyang Xiaogang (信義) は、設計プロセスにおける TARS-RPA-Agent の主な問題点と革新的な機能を詳細に紹介しました。

①自律的解体タスク:複雑な問題、分割統治

実際のシナリオでは、人間による複雑な指示が非常に簡潔なステートメントに含まれることが多く、これは大規模なモデルを通じて Python コードを生成したり、単に 3 ~ 5 つの RPA コンポーネントを呼び出したりするだけでは実現できません。

TARS-RPA-Agent は、単純だが複雑な命令の Chain-Of-Thought スタイルの自律的な分解と洗練をサポートし、分解されたサブタスクと特定のステップを実際の RPA プロセス ブロックとコンポーネントのマッピングと比較し、最終的に統合された、高度に制御可能な複雑なプロセス。

たとえば、「ラップトップを購入したいので、それを推奨するのを手伝ってください」という場合、TARS-RPA-Agent はそれを「ショッピング Web サイトにログインし、ラップトップのブランド、構成、価格、その他の情報をクエリし、完全な製品の推奨事項」に分解できます。などの複数のステップを自動的に実行します。

② 現在の環境を認識する:人間の視点、画面を理解する

「コマンドの意味を理解した上で操作する画面上の入力ボックス、ログインボタン、チャットウィンドウを正確に見つけるにはどうすればよいでしょうか?それがブラウザベースのソフトウェアだけでなく、さまざまなCSアーキテクチャを持つ何千もの顧客の場合はどうでしょうか?」ターミナルソフトが…」

「あなたは私の目です」、大型コンピュータ ビジョン モデルに基づいた「インテリジェント スクリーン セマンティック 理解」テクノロジー (ISSUT) は、TARS-RPA-Agent に世界を認識する目を備え、真に人間に基づいたコンピュータ スクリーンと操作オブジェクトをもたらします。ビジョンは理解します。

ISSUT を使用すると、TARS-RPA-Agent は数秒で画面を「理解」し、手動介入なしで最初の自動分析を完了できます。Web ページのソース コードを解析できない、またはクライアント ソフトウェアが API インターフェイスを開けない実際の多くのシナリオでは、ISSUT の価値は二重に顕著になります。

たとえば、API インターフェイスを開かないエンタープライズ WeChat を手順を理解して自動的に操作します。

③実行とフィードバック:連動、ワンステップ最適化

PDCA(計画、実行、評価、実行)は人間の優れた作業習慣であり、その実行過程において継続的なフィードバックと修正が行われることは客観世界の一般法則です。実際のシナリオにおける意図の理解とタスクの実行は非常に複雑であり、TARS-RPA-Agent は、理解の逸脱や操作エラーによるタスクの完了の失敗を避けるために、操作の各ステップの正確性を保証する必要もあります。

したがって、TARS-RPA-Agent は、意思決定および実行プロセスの正確性と制御性を継続的に向上させるために、「強化学習と実行の各ステップのフィードバックに基づくワンステップ最適化戦略」の関連メカニズムを独創的に設計しました。

たとえば、以前のアクションに基づくヒューリスティックな最適化:

④記憶歴史体験:拡張検索、長期記憶

「聖闘士は同じ手口では二度と負けない。」 TARS-RPA-Agent はエージェントとして、歴史的な経験を学習し、歴史的な事例を通じて継続的に改善できるように、自律学習と反復能力を向上させる必要もあります。タスク中に同様の独立した意思決定能力に遭遇すると、人間と機械のコラボレーションの効率が継続的に向上します。

大規模モデルのコンテキスト保持や意思決定の最適化などの長期記憶機能は、通常、メモリ管理やその他の手段によって実現されます。また、TARS-RPA-Agentは、コンテキスト拡張やベクトル検索などの技術を組み合わせ、長期記憶機能を備えており、過去のタスクの実行状況やユーザーの修正、実行結果などをデータベースに保存することをサポートし、その後の分析と最適化の基礎として使用します。

無限の可能性を広げる『TARS+』

記者会見には、リアルスマートのパートナーで製品イノベーション部門の責任者である周春昭氏(サウロン)、リアルスマートのパートナーでイノベーション研究開発センターの責任者である趙明氏(ナルト)、製品専門家の張一豪氏が出席した。 (Tuohai)、Zhang Xinyan (Yu Ji) らは、新しい経験とインテリジェンスに満ちた超自動化製品のマトリックスを備えた TARS 大型モデルのディープインテグレーション製品を次々と発売し、IPA デジタル担当者は、新荘国内を全面的にサポートします。

TARS+RPA=ChatRPA

TARS+IDP=チャットIDP

TARS+プラットフォーム=チャットプラットフォーム

TARS+国内新荘IPAデジタルスタッフ

リアル インテリジェンスは、「AI がビジネスに力を与える」という当初の目的を常に堅持し、人間と機械のコラボレーションとハイパーオートメーション時代の明るい未来を強く信じており、過去 3 年間、継続的に新製品の発表を行って継続的なスピードを上げてきました。業界のイノベーションのペースを上げる:

2022.12.7 「Butterfly Change · New Fan」、ドラッグ アンド ドロップの必要がなく、クリックするだけでリアル IPA モードを選択できるため、誰でも RPA を真に利用できるようになります

2022.3.31 「大好きなAI、新しくて革新的」、常に革新する、常にAI

2021.10.18 革新的かつ最先端のフュージョンピックアップテクノロジーがもたらす「無限と無限」

2021.5.25 「New・Dynamic・Smart・Burn」、イノベーションにおける真のブレークスルー

2021.1.8 リアルRPAの急速な反復進化で「繰り返しは私のもの、創造はあなたのもの」が可能に

2020.7.15 本当の最初の挨拶:「Smart drive the future丨こんにちは、デジタル社員」!

このプレスカンファレンスでは、TARS+ISSUT 大型モデル ダブルベースがハイパーオートメーションの新しいビジョンをもたらし、TARS-RPA-Agent が「PC がやってくれる!」というより高いレベルの人間とマシンのコラボレーションを実現します。

将来的には、リアル インテリジェンスは、モデルのパフォーマンスとセキュリティを十分に評価して修正した後、TARS-Finance-7B 財務モデルをコミュニティにオープンソースして、生成的な大規模モデルの方向に向けた学術研究とアプリケーション開発を促進する予定です。また、より多くの機能の登場を歓迎するために、TARS 垂直大規模モデルのパラメータ スケールの拡張も継続します。

Shizhizhiは今後も国内外の学界、産業界の仲間たちと協力し、無限の可能性を秘めた向こう側へ向かって進んでいきます。

いつものように、私たちは別れを告げることはありません。次回のスマート製品発表カンファレンスで、より高い頂点でお会いしましょう。

おすすめ

転載: blog.csdn.net/SHIZAIZHINENG/article/details/132343738