LLM ベースの生成 AI は、RPA と人間とコンピューターのインタラクションを急速に変化させています

RPA がプログラム開発と自動化にどのような貢献をしたかを尋ねると、答えの 1 つは、人間とコンピューターの相互作用 (HCI、人間とコンピューターの相互作用) を変えたということです。

従来のワークフロー自動化ツールでは、ソフトウェア開発者は、内部アプリケーション プログラミング インターフェイス (API) または特殊なスクリプト言語を使用して、アクションのリストを生成し、タスクを自動化し、バックエンド システムとインターフェイスする必要があります。

RPA システムは、ユーザーがアプリケーションのグラフィカル ユーザー インターフェイス (GUI) でタスクを実行するのを監視してアクションのリストを作成し、GUI でこれらのタスクを直接繰り返すことで自動化を実行し、複数のアプリケーションにわたってデータを処理できます。

「プラグイン」として知られるこの一見単純な形式は、製品で自動化を使用する際の障壁を効果的に軽減し、さらに多くの組織のエンドツーエンドの自動化を可能にします。

デジタル ワーカーの労働形態を変えるビジネス プロセス自動化テクノロジーとして、20 年以上にわたって人材を単純で反復的な作業から解放するだけでなく、プログラム開発も容易にしてきました。同時に、「人間 + RPA」人間とコンピューターの対話モデルも作成され、組織が人間とコンピューターのコラボレーションをより簡単に実現できるようになりました。

特に近年、十分に成熟し、柔軟でスケーラブルで信頼性の高い RPA プラットフォームが出現して以来、多くの大企業は RPA を使用してビジネス プロセスと開発モデルを改善および最適化し、効率を高めてコストを削減できます。

上記の実現は、RPA によるビジネス プロセスの自動化とプログラム開発における人間とコンピューターの対話の継続的な改善と最適化によるものです。

そうです、RPA は多くのテクノロジーに支えられ、より多くの業界に浸透し続けている一方で、さまざまな分野のさまざまなビジネス シナリオにおける人間とコンピューターのインタラクションも継続的に変化させています。

特に近年、AI技術を深く融合させたRPAが再び人気を集めています。RPA を中核としたハイパーオートメーション テクノロジ コレクションには、オートメーション関連のテクノロジがすべて含まれているため、エンドツーエンドのオートメーションによる人間とコンピュータのインタラクション エクスペリエンスが向上し続け、より多くの組織に支持されています。

現在、AI ラージ モデルの時代が到来しており、進化を続ける RPA にも生成 AI テクノロジーが統合されています。LLM(Large Language Model、大規模言語モデル)を統合した現在の RPA は、人間とコンピュータのインタラクションにおける大きな進歩であり、以前の RPA モデルを覆すものであるとさえ言えます。

RPA の人間とコンピューターの対話に対する LLM の影響について話したいので、人間とコンピューターの対話から始めるのは自然なことです。LLM は人間とコンピューターの相互作用にどのような影響を与えますか? RPA は人間とコンピューターのインタラクションをどのように改善するのでしょうか? LLM は RPA にどのような影響を与えますか?

01

ヒューマンコンピュータインタラクションから

1970 年代、ほとんどのオフィスはまだ金属ファイル、タイプライター、大量の紙を使って運営されていました。かさばるコンピューターは、数人しか操作できない寒い部屋にしか保管できません。

これらの問題を解決するために、いくつかの企業がパーソナル コンピュータの開発を始めました。ゼロックスは 1973 年に Xerox Alto を開発しました。この製品は高コストなどの問題により発売には至りませんでしたが、GUI の最初のスケッチとなり、Macintosh (マッキントッシュ コンピュータ) や Windows のインスピレーションの源となりました。

一連の研究とそれに伴う開発、および当時の市場での小型コンピュータに対する強い需要の影響を受けて、コンピュータをよりユーザーフレンドリーにする方法とその理由を研究する手段として、人間とコンピュータのインタラクションという概念が誕生しました。新しい分野は 1970 年代後半から 80 年代前半に登場しました。

それ以来、HCI の分野は成長を続け、主に社会の最も複雑な問題を解決するために人間の行動を分析し、人々がコンピュータとどのように対話するか、およびユーザーがコンピュータとどの程度対話できるかを研究し、成功する対話を行い、どの分野がより多くの対話を必要とするかを調査することを目的としています。関連開発。

当時の社会生産性の鋭い矛盾を解決する能力により、HCIの研究領域は短期間にIT分野全体に広がりました。

同時に研究者たちは、コンピュータとの対話を IT 専門家だけでなくすべての人に拡張する必要があることに気づきました。したがって、数年以内に、HCI は情報テクノロジ設計のほぼすべての変更に急速に拡大しました。

スティーブ・ジョブズらの努力により、アップルは 1984 年にパーソナル コンピュータ Macintosh を発売し、人間とコンピュータの相互作用の形を完全に変えました。これにより、コンピュータの使用が容易になり、コミュニケーションが簡単になり、キーボード、マウス、アイコンベースのユーザー インターフェイスが流行しました。

その後、Apple がパーソナル PC の先駆者となり、Microsoft が Windows システムを発売すると、これらの製品とソフトウェアは世界的なビジネス プロセスとオフィスにおける人間とコンピュータの対話の形式を完全に変え、破壊しました。

これらは誰もがよく知っているので、ここで紹介する必要はありません。

今日に至るまで、IoT はネットワーク接続の基盤となり、人工知能はユビキタスになり、人間とコンピューターのインタラクションは依然としてさまざまなテクノロジー、製品、ソリューションの焦点となっています。

これまでの簡単な開発の歴史を通じて、誰もが人間とコンピューターの相互作用について一般的に理解しているはずだと思います。では、人間とコンピュータの相互作用とは一体何でしょうか? 次のセクションを参照してください。

02

人間とコンピュータの相互作用の 4 つの要素、6 つの目標、および 7 つの原則

一般的な定義によれば、ヒューマン・コンピュータ・インタラクション技術(ヒューマン・コンピュータ・インタラクション技術)とは、コンピュータの入出力装置を通じて人間とコンピュータの間の対話を効果的な方法で実現する技術を指します。

ヒューマン・コンピュータ・インタラクション技術には、機械が出力装置または表示装置を介して大量の関連情報を提供し、指示を求めることと、人間が入力装置を介して関連情報を機械に入力し、質問に答え、指示を求めることが含まれます。したがって、人間とコンピュータのインタラクション技術は、コンピュータのユーザーインターフェイス設計における重要な内容の一つです。

学術的には、ヒューマン コンピューター インタラクションは、人間が使用する対話型コンピューティング システムの設計、評価、実装、およびそれらを取り巻く主な現象の研究に関係する分野です。

ヒューマン・コンピュータ・インタラクションは、人間(ユーザー)とコンピュータの間のインターフェース(インタラクション・インターフェース)、およびコンピュータ・テクノロジーの設計と使用に焦点を当てています。人間とコンピューターのインタラクションは、コンピューター科学、心理学、社会学、グラフィック デザイン、工業デザインなどを含む多くの分野をカバーしており、非常に包括的な現代科学です。

ウィキペディアは、この相互作用を促進するには人間とコンピュータの間のインターフェースが不可欠であると考えています。デスクトップ アプリケーション、インターネット ブラウザ、PDA などは、今日の一般的な GUI を利用しています。音声認識および合成システムは、音声ユーザー インターフェイス (VUI) を利用します。

新しいマルチモーダルおよびグラフィカル ユーザー インターフェイスにより、人々は他のインターフェイスではできない方法で特定のキャラクターやエージェントと対話できるようになります。

したがって、人間とコンピューターのインタラクション分野の発展により、インタラクションの質が向上し、多くの新しい研究分野が生まれました。従来のインターフェイスを設計する代わりに、さまざまな研究部門が、ユニモーダルではなくマルチモーダル、コマンド/アクションベースのインターフェイスではなくインテリジェント適応インターフェイス、パッシブではなくアクティブインターフェイスの概念に焦点を当てています。

人間とコンピュータの相互作用という名前から、それは 3 つの部分、つまりユーザー、コンピュータ自体、およびそれらが連携する方法で構成されていることが推測できます。

これら 3 つの部分は、後にユーザー、タスク、ツール/インターフェイス、コンテキストという 4 つの基本要素に拡張されました。

  • プロジェクトで共同作業するユーザー、個人、または個人のグループはユーザー コンポーネントと呼ばれます。HCI はユーザーのニーズ、目標、インタラクション スタイルを研究しています。

  • タスク、つまり目標指向のタスク。ユーザーはコンピュータを使用するときに常に目的または目標を持っています。これを達成するために、コンピューターは物事のデジタル表現をレンダリングします。

  • インターフェイス、つまり、ユーザー インタラクションの品質を向上させることができる基本的な HCI 要素はインターフェイスです。インタラクションの種類、画面解像度、ディスプレイ サイズ、さらには色のコントラストなど、考慮すべきインターフェイス関連の要素が数多くあります。

  • 背景として、HCI はユーザーとコンピューター間の通信を改善するだけでなく、システムがアクセスされるコンテキストや環境も考慮に入れます。

同時にHCIは、効率的な使用(効率)、安全な使用(安全性)、優れた実用性(実用性)、簡単に学習できる(学習性)、および使い方を覚えやすい(記憶性)という6つの目標を掲げています。

これに基づいて、HCI の 7 つの設計原則も次のように導き出されます。

原則 1: フェアユース。

原則 2: 柔軟な使用。

原則 3: シンプルで直感的に使用できる。

原則 4: 機密情報。

原則 5: フォールトトレランス。

原則 6: 身体的な負担が少ない。

原則 7: サイズとスペースのアプローチと使用。

特定のアプリケーションでは、モノのインターネット、視線追跡技術、音声認識技術、AR/VR の使用、およびクラウド コンピューティングはすべて、人間とコンピューターの対話の非常に典型的なケースです。

HCI 開発の歴史と多数の意見や事例は、テクノロジーが HCI を大幅に改善できることを証明しています。

通信技術と情報技術の進歩と発展により、それらは HCI に明らかな影響と改善をもたらし続けています。たとえば、近年 AI テクノロジーの助けを借りて普及している RPA は、ビジネス プロセスの自動化やオフィス ビジネス シナリオに人間とコンピューターの優れたインタラクションとエクスペリエンスの向上をもたらしました。

03

人間とコンピュータのインタラクションと RPA

前述したように、人間とコンピューターの対話の目標は、コンピューターが人間のニーズによりよく適応し、音声認識、画像認識、自然言語処理、ジェスチャー制御など、よりフレンドリーでインテリジェントで自然な対話方法を提供できるようにすることです。

RPA は、ソフトウェア ロボットを使用して人間の操作をシミュレートするテクノロジーであり、ユーザー インターフェイスを通じてエンタープライズ アプリケーション システムと対話し、予想されるタスクを実行できます。

現代の RPA には、人工知能 (AI) と機械学習 (ML) の組み合わせも組み込まれており、インテリジェント プロセス オートメーション (IPA) を可能にし、自然言語処理 (NLP)、コンピューター ビジョン (CV)、データ分析などのより複雑なユースケースを処理します。 。

RPA は、反復的なルールベースのワークフローを自動化し、作業効率、正確性、コンプライアンスを向上させ、人件費を削減し、エラー率を減らし、コストと時間を節約することができ、財務、人事、供給など、反復的で標準化されたさまざまなビジネス シナリオに適用できます。チェーン、情報技術など。

現代のエンタープライズ管理ソフトウェア システムやさまざまな自動化ツールの中で、RPA は、運用の難易度、導入サイクル、投資コストの観点から、組織が人間と機械のコラボレーションを適用する最良の方法と見なされます。

中でもRPAの最大のメリットは、プログラム開発の難易度を下げ、簡単なアプリケーションの開発に第一線の業務担当者が参加できるようになり、万人向けの開発がさらに実現できることです。

RPA がこれを可能にする理由は、プログラム開発における人間とコンピューターの対話モードを変えるためです。RPA ツールの助けを借りて、プログラミングの方法を知らない一般の従業員も、プログラマーのように必要な自動化プログラムやソフトウェア ロボットを開発できます。

RPA を使用すると、コードの作成からさまざまな機能コンポーネントの「ドラッグ アンド ドロップ」に至るまで、プログラムの開発が容易になる一方で、より多くのビジネス プロセスを自動化できるため、手動での実行が不要になります。RPA は、プログラム開発と業務実行における人間とコンピューターのインタラクションを同時に変えたと言えます。

したがって、RPA は人間とコンピューターのインタラクションと密接に関係しています。RPA は本質的に人間と機械の共同作業モードであるため、人間がルールを定義し、実行を監督し、最適化および改善する必要があり、機械はルールの実装、フィードバックの提供、学習と改善を担当します。

RPAは人間の操作をシミュレートするだけでなく、AIテクノロジーを組み合わせて人間の理解と意思決定を実現します。たとえば、OCR (光学文字認識) テクノロジーを使用して画像内のテキストを認識し、NLP テクノロジーを使用して言語の意図を理解し、インテリジェントな意思決定テクノロジーを使用して最適なソリューションを策定します。

AIなどの技術と連携したRPAには以下のようなメリットがあります。

1. 作業負荷を効果的に削減し、退屈なバックグラウンドタスクから人々を解放し、より価値のあるイノベーションと戦略的な作業に集中させます。

2. 人間とコンピュータの対話の速度と品質の向上 ソフトウェア ロボットは、時間、場所、感情に影響されることなく 24 時間稼働でき、間違いや省略をしません。

3. 人間とコンピューターの対話の範囲と深さを拡大する ソフトウェア ロボットは、関連性のない複数のソフトウェア システムにアクセスして統合し、大量の構造化データと非構造化データを処理し、AI と ML の機能を使用して学習し、最適化することができます。

したがって、RPA は人間とコンピューターのインタラクションを最適化するための効果的な代表的なテクノロジーです。プロセスの自動化、インテリジェンス、最適化を実現し、企業に効率、品質、価値の向上をもたらします。

04

人間とコンピュータのインタラクションに対する LLM の影響

LLM は、ニューラル ネットワークを使用して大量のラベルなしテキストに対して自己教師あり学習または半教師あり学習を実行する言語モデルです。LLM には多数のパラメータ (通常は数十億以上) があり、さまざまなタスクで優れたパフォーマンスを発揮します。

さまざまな分野での現在のアプリケーションから判断すると、LLM ベースの生成 AI テクノロジーの出現は、人間とコンピューターの相互作用に破壊的な変化をもたらしました。

生成 AI の最も直接的な実感は、元のワークフローにおけるさまざまなソフトウェア操作やソフトウェア間操作の多くが、生成 AI とのわずか数回の対話で完了できることです。

たとえば、Midjourney を使用して画像を生成したり、ChatGPT Plus を使用してソフトウェア アプリケーション コードを生成したりする場合、描画ソフトウェアやプログラミング ソフトウェアを使用する必要はまったくありません。そして、ChatGPT のプラグイン エコロジーは急速に改善されており、将来的には対話のみで実行できるアプリケーション シナリオでのビジネス オペレーションがますます増えていくでしょう。

これはインタラクションの方法の変化であり、さまざまなソフトウェア UI を使用した本来の人間とコンピューターのインタラクションを、チャット ウィンドウとのインタラクションに直接変更し、これまでにないインタラクティブな体験を実現します。

要約すると、LLM または生成 AI は人間とコンピューターの相互作用に次のような影響を与えています。

まず、人間とコンピューターの対話の効率、品質、利便性が向上します。生成型 AI により、ユーザーは多くの時間と労力を費やすことなく、必要な情報やサービスを迅速に入手できます。同時に、LLM はユーザー入力とコンテキストに応じて適切な応答を生成し、ユーザー入力の負担を軽減し、対話の流暢さと自然さを向上させることができます。さらに、生成 AI は、ユーザーのフィードバックや好みに応じて出力を動的に調整し、より良いインタラクション効果を実現することもできます。

たとえば、ChatGPT は、ユーザーが執筆、デザイン、プログラミングなどの複雑なタスクを完了するのを支援したり、ユーザーにパーソナライズされた推奨事項、相談、エンターテイメント、その他のコンテンツを提供したりできます。

第二に、人間とコンピューターの相互作用の多様性と創造性を高めます。LLM は、ユーザーのニーズや好みに応じてさまざまなスタイルのテキスト、オーディオ、ビデオ、その他のコンテンツを生成し、ユーザーのパーソナライズされた多様化したニーズを満たすことができます。生成 AI を通じて、ユーザーはより多くのコンテンツにアクセスして選択できるため、視野と思考が広がります。もちろん、生成AIはユーザーとより深く柔軟な対話を行い、ユーザーのさまざまな感情的および感情的なニーズを満たすこともできます。

たとえば、生成 AI を通じてテキスト、画像、音楽などのさまざまなスタイルやテーマをユーザーに提供したり、詩、物語、ジョークなど、ユーザー向けに斬新で興味深いコンテンツを生成したりできます。

第三に、人間とコンピューターの相互作用の関係と意味を変えます。生成 AI を通じて、ユーザーは人工知能とのより密接で信頼できるつながりを築き、さらには共創や協力の感覚を生み出すことができます。

LLM ベースのチャットボットは、ユーザーにさらに多くのフィードバックや提案を提供したり、考えや感情をユーザーと共有したりできます。また、生成 AI を使用すると、ユーザーは自分自身と AI の長所と限界、およびそれらをより良く活用し開発する方法をより認識できるようになります。

第 4 に、人間とコンピュータのインタラクションの分野とシナリオを拡大します。ChatGPTのような生成AIアプリケーションは高い適応性と汎用性を備えており、教育、エンターテイメント、医療、ビジネスなどのさまざまな分野やシナリオに適用できます。ユーザーは、学びたい、遊びたい、相談したい、買い物したいなど、ChatGPT などのアプリケーションと通信することで目的を達成できます。

5 番目に、人間とコンピューターの対話の楽しさと親密さを高めます。LLM ベースの生成 AI アプリケーションは、豊富な知識と個性を備えており、ユーザーの興味や感情に応じて独自の言語スタイルやトピックを調整でき、ユーザーを楽しませるためにユーモア、詩、物語などの創造的なコンテンツを生成することもできます。

これにより、ユーザは、ロボットとのコミュニケーションを退屈なものと感じることなく、ロボットとのコミュニケーションが面白くて温かいものであると感じるようになる。

LLM は人間とコンピューターの相互作用に重要かつ複雑な影響を及ぼし、さまざまな分野で大きな開発の可能性と産業応用価値をもたらします。組織は、人間とコンピューターの相互作用のレベルとエクスペリエンスを向上させ、人間とコンピューターの相互作用の効率と品質を向上させ、人間とコンピューターの相互作用の関係を強化し、人間の領域とシナリオを拡大するために、LLM と生成 AI を積極的に探索および活用する必要があります。 -コンピュータの相互作用。

もちろん、それがもたらすリスクと課題、そしてそれを合理的に使用および監督する方法にも注意を払う必要があります。

大規模言語モデルに基づく生成 AI は RPA と急速に融合しており、生成 AI は RPA の人間とコンピューターのインタラクションに質的な飛躍をもたらすことになることに注意してください。

06

LLM が RPA のヒューマン コンピュータ インタラクションを変える

RPA は、反復的で定期的で価値の低いビジネス プロセスを自動化できるため、効率が向上し、コストが削減され、エラーが削減されます。しかし、複雑で変化しやすい高価値のビジネス シナリオに対処することの難しさ、継続的なメンテナンスと更新が必要なビジネス プロセスの変化に適応することの難しさ、複雑で構造化されていないビジネス シナリオに対処することの難しさなど、いくつかの課題と制限にも直面しています。創造力や判断力を必要とする作業など

超自動化アーキテクチャにより RPA の動作は十分に安定しましたが、複雑なプロセスの安定した動作には隠れた危険性もあります。

メーカー各社はこれまで様々な方法でこれらの問題を解決しようと試みてきましたが、根本的に解決することはできませんでした。LLM ベースの生成 AI が登場するまでは、RPA が直面する複数の問題を一度に解決していました。

ここでは、LLM が RPA の人間とコンピューターの対話をどのように変えることができるかについて簡単に説明しましょう。

LLM は、RPA に、より強力な自然言語処理機能、より強力な知識の取得および推論機能、およびより強力な生成および作成機能を提供できます。

具体的には、LLM が RPA と人間とコンピューターの対話に及ぼす影響は、次の側面に反映される可能性があります。

RPAのインテリジェンスレベルを向上させます。LLM のアプリケーションは、ユーザーの自然言語入力をより適切に認識して理解し、ユーザーのニーズと意図をより適切に満たす自然言語を生成できます。また、コンテキストと目標に基づいて適切な操作ステップを生成し、複数ラウンドの対話と推論を実行し、より複雑で多様なビジネス シナリオを処理し、より複雑で柔軟なビジネス プロセスの自動化を実現することもできます。

ユーザーは、複雑なプログラミングやコンポーネントのドラッグ アンド ドロップによるプロセスの設計を必要とせずに、音声またはテキストを通じて RPA に話しかけ、実行するタスクを指示できます。

さらに、LLM は RPA による知識の抽出と推論の実行を支援し、より価値のある情報と提案を提供します。

RPAの適用範囲を拡大します。LLM は RPA の適用範囲を効果的に拡張し、ソフトウェア ロボットがテキスト分類、テキスト要約、テキスト生成、機械翻訳、質問応答システムなどの自然言語を含むより多くのタスクを処理できるようにします。また、画像、音声、ビデオなどの他のモーダル データと対話して、より豊かで多次元のビジネス プロセスを実現することもできます。

LLM を使用すると、ソフトウェア ロボットが OCR、NLP、ローコード、プロセス マイニング、チャットボットなどの他の AI テクノロジーと統合および連携して、ハイパーオートメーションを実現することもできます。

LLM を使用することで、RPA は言語や文化の壁を越えて、より広範囲で多様な顧客や市場にサービスを提供できます。

RPA のイノベーションの可能性を高めます。LLM は RPA の創造性と柔軟性を強化し、さまざまなシナリオやデータに基づいてレポート、概要、提案などの適切なテキストを生成できるようにします。たとえば、RPA は、ユーザーが提供したキーワードやトピックに基づいてブログ投稿を自動的に生成し、関連する写真、ビデオ、リンクなどを投稿に挿入できます。

LLM を使用することで、RPA はより柔軟で適応的な学習と生成を実行し、より斬新で興味深いコンテンツとソリューションを生成できます。LLM はまた、人間とより効果的かつ友好的に共同作業やコミュニケーションを行うことができ、創造性やインスピレーションをさらに刺激します。

RPAの開発効率を向上します。生成 AI を使用すると、ユーザーは複雑なコードを記述したりグラフィカル インターフェイスを使用したりすることなく、単純な言語記述を通じてビジネス プロセスを定義および変更できます。また、ユーザーのフィードバックとデータ分析に基づいてビジネスプロセスを最適化および調整し、継続的な改善を実現します。

RPA インタラクション エクスペリエンスとユーザー満足度を最適化します。LLM と統合された RPA は、ユーザーとより自然でフレンドリーで興味深い対話を行うことができ、ユーザーの信頼と参加感を高めます。RPA は、ユーザーの感情や興味に応じてトーンやスタイルを調整したり、ユーモアを伝えたり、有名な名言を引用して雰囲気を調整したりすることもできます。

もちろん、LLM が RPA の人間とコンピューターの対話に及ぼす影響は、インテリジェンス、効率、イノベーションの点だけでなく、RPA のソフトウェア アーキテクチャの変化にも直接影響します。

07

追記:LLMの影響でRPAアーキテクチャが変更

LLM が登場する前、RPA はプログラム開発とプロセス自動化における人間とコンピューターの対話を大幅に改善しました。また、すでに多くのメーカーが「誰でもRPAを利用できる」というコンセプトを打ち出しています。このコンセプトの背景には、実は RPA の使いやすさがますます高まっており、プログラムの開発やプロセスの自動化への適用が容易になっていることが挙げられます。

CV から画面キャプチャ、AI モデルに至るまで、使いやすさの点で、メーカーは多くの探求と実験を行ってきました。RPA プログラム開発の過程では、AI やゼロコードなどのテクノロジーに基づいて、RPA は当初の「ドラッグ アンド ドロップ」形式を徐々に廃止し、「クリック アンド セレクト」および会話型 (音声駆動を含む) プロセスに移行しています。創造。

人間とコンピューターの対話という観点から見ると、会話型プロセスの作成は RPA、さらにはハイパーオートメーションの究極の状態であると言えます。将来的には、ハイパーオートメーションが使用され、システムに数行入力するか単語を話すだけで、さまざまなソフトウェア ロボットや自動化プログラムを作成できるようになります。

ただし、以前の会話形式の作成は、単純な事前設定プロセスにのみ適しています。わずかに複雑なプロセスでは何も実行できないか、達成するためにより多くのプロセスをトリガーして動員するためにより多くのプロセス ステップが必要になります。プロセスの堅牢性はテストに耐えることが難しく、ユーザーは対応する構文と使用する手順に精通している必要があります。

アプリケーションのエクスペリエンスに関しては、まだいくつかの欠点や改善の余地があります。

LLM の出現後、生成 AI を組み込んだ RPA 製品では、ユーザーは自然言語を使用して RPA を駆動し、プロセスを作成できるようになりました。

そして、生成 AI は、生成されたコンテンツの形で感情認識と非構造化データ処理における RPA の欠点を補い、多くの学習を必要とせずに、誰でも RPA を駆動してさまざまな自動化プログラムをより簡単、迅速、効率的に開発できるようになり、まさに RPA を誰でも利用できるようになります。

従来、RPAを利用する場合、人がRPAを直接操作して、ブロックをプルしたりビルディングしたりしてさまざまなプログラムを構築していました。現在、人間は GPT などの生成型 AI と自然言語を通じてコミュニケーションし、人間の操作意図を理解した上で、マルチモーダル AI がさらに RPA を推進し、企業管理ソフトウェアと接続してさまざまなビジネス プロセスを自動化します。

GPT などの AI 大型モデルは、人間と RPA などのシステムをさらに接続し、人間の意図を上方向に接続し、RPA ロボットに下方向に命令することで、人間と RPA などの自動化システムの間のリンクとなり、プログラム開発と自動化されたプロセスの運用を容易にします。

GPT は人々を RPA ベースのハイパーオートメーションに接続します。これにより、人間とコンピューターの対話エクスペリエンスが大幅に向上します。

過去の「人間 + RPA」から現在の「人間 + 生成 AI + RPA」に至るまで、LLM と統合生成 AI の導入により、表面的には RPA 製品の人間とコンピューターのインタラクションが大幅に改善されました。 RPA の構造変更に影響を与えました。

現在、ほぼすべてのメーカーが LLM、RPA、ハイパーオートメーションの包括的な統合について熱心に研究しており、RPA は製品アーキテクチャにモデル層を追加しています。

これは、サードパーティモデルであろうと自社開発モデルであろうと、RPA がモデル層の標準アプリケーションになったことを意味します。

LLM が RPA の標準構成となることで、大型モデル時代の RPA も包括的に変化することが予想されます。

おすすめ

転載: blog.csdn.net/bruce__ray/article/details/131022729