ChatGPT + X = より多くの可能性

ChatGPTは、さまざまな先進的な機能を備えており、公開されると大きな注目を集め、OpenAIで学習された大規模自然言語処理モデルとして、自然言語生成、言語翻訳、自然言語理解、自然言語理解、言語理解などの一連の機能を実現できる。そして言語の要約リリースから 2 か月後、月間アクティブ ユーザー数は1億人を超え、史上最も急速に成長しているコンシューマー アプリとなっています。

実際、ChatGPTの開始は、生成AI商用化の 1 年目を正式に記念するものです生成AIとは、機械学習手法を通じてデータからコンテンツやオブジェクトを学習し、学習したモデルに基づいて完全にオリジナルの新しいコンテンツを生成することであり、自然言語処理、画像生成、音声生成など、さまざまな分野で広く利用されています。等

Gartner は、 2025 年までに生成AI が生成されるデータ全体の10%を占めるようになると予測していますが、現在の割合は1%未満です。生成AIの商用化の見通しは幅広く、その商用応用の方向性には主に次のようなものがあります。

  •  よりスマートな情報の検索と処理を実現します。最近、Microsoft は、 ChatGPTを統合したBing検索エンジンの新バージョンをリリースすると発表しました。ChatGPT、検索エンジン機能を部分的に置き換え、ユーザーの質問に基づいて既存のナレッジ ベースを取得し、より直感的な回答を提供できます。将来的には、ChatGPT がOfficeツールのフルセットに接続され、ユーザーによる情報の要約、抽出、翻訳を支援することが期待されています。

  •  専門分野向けの垂直サービス。生成AI は、電子商取引、広告マーケティング、コーディングなどのプロフェッショナル サービス分野で広く使用でき、主要な専門業務の一部を置き換え、人間のアシスタントとして機能し、企業の人件費を大幅に節約し、生産効率を向上させるのに役立ちます。

しかし、ChatGPT は既存のテクノロジーとどのように統合するのでしょうか? 例として、ChatGPT+ナレッジ マップとChatGPT+オフィス オートメーションから始めましょう。

1.ChatGPT +ナレッジグラフ

事実誤認はChatGPTが現在抱えている比較的大きな問題であり、いくつかの質問に答えると、必然的に人々に重大なナンセンスの印象を与えてしまいます。解決策は、それにどのように介入するかであり、外部の知識を導入して処理し、

外部知識を導入する方法としては、回答中にリンクを設ける方法があり、回答内容に事実誤認がある場合でも、リンクを介して人手による検証を行うことで事実誤認の問題を解決することができます。

d1252b28a196eacac9c86e4d2aacc7ca.png

外部知識を導入するもう 1 つの方法は、ナレッジ グラフです。知識マップは二項関係に基づく知識ベースであり、現実世界のエンティティまたは概念とそれらの関係を記述するために使用されます。基本単位は [エンティティ - 関係 - エンティティ ] の 3 つ組です。関係を通じて相互接続されてネットワーク構造形成ます。 。

基本的に、知識マップは本質的に知識表現方法であり、特定のビジネス ドメインの知識構造)概念、エンティティ属性、エンティティ関係、イベント属性、イベント間の関係( その後、エンティティ認識、関係性抽出、イベント抽出などにより、さまざまなデータソースから構造化データが抽出され、知識が埋め込まれ、最終的に属性グラフまたはRDF形式で保存されます。

実際、初期にPTM ( LLMではなく)を対象とした場合、 PTM (事前トレーニング済み言語モデル) は知識ベースであり、分析と理解のための知識探索やLLM (chatgpt) などの多数のタスクが含まれると言われていました。 )はパラメータ化された知識です。KGの利点は、デバッグに便利で、人間が理解しやすく、グラフ構造を表現する能力が高いことです。

しかし、これら 2 つの点は、特に推論(常識とドメイン推論)、ビジネス システムの相互作用、ハイパーオートメーション、時間に敏感なコンテンツのアクセスと更新などの観点から組み合わせることができます。組み合わせの例は数多くあります。

たとえば、さまざまなグラフ タスクのテキスト生成マッピングの場合、 KG自体は、ルール推論などの数値計算を含む、より適切なシンボルを実行します。これは、この部分が実際にはLLMに対して比較的弱いか、学習効率が低すぎるためです。ナレッジ グラフをChatGPTに統合するには、さまざまな方法があります。十分な正しい知識を与えた上で、ナレッジ グラフなどのナレッジ マネジメントおよび情報注入テクノロジを導入し、生成されるコンテンツの信頼性を高めるためにデータ範囲と適用シナリオを制限します。

たとえば、ナレッジ グラフ内のエンティティと関係を埋め込みベクトルとして表現し、モデルのパフォーマンスを向上させる追加機能としてモデルに組み込むことができます。この方法では、ナレッジ グラフの構造情報と意味情報の両方をモデルに統合できるため、モデルは自然言語テキストをよりよく理解して生成できます。

会話では、ナレッジ グラフはモデルが会話のコンテキストを理解し、質問に答えるためのより正確な情報を提供するのに役立ちます。LaMDA論文では、会話のコンテキスト情報を提供するためにナレッジ グラフが使用されています。ナレッジ グラフからの情報を組み合わせることで、ユーザーがエンティティと関係の間のセマンティクスとコンテキストをよりよく理解できるように質問を自動的に生成できます。

Baidu は数日前、生成大規模言語モデル「Wen Xin Yi Yan」を正式にリリースしました。その基礎となる「Wen Xin ラージ モデル」( Ernie 3.0 ) はナレッジ グラフを組み合わせています。Wenxin が登場する前は、LLM の大規模モデルのほとんどはプレーン テキスト データを使用していました。たとえば、1,750億のパラメーターからなるGPT-3コーパスには、一般的なクロールからのフィルター処理されたテキストが570 GB含まれています。これらの原典には、言語知識や世界知識などの知識の明示的な表現が欠けています。さらに、大規模なモデルのほとんどは自己回帰的な方法でトレーニングされており、そのようなモデルは、下流の言語理解タスクに適応させた場合、従来の微調整では低いパフォーマンスを示します。

理論的に言えば、ナレッジ グラフの導入により、下流アプリケーションの問題を理解し、実際的な問題を解決する際の Wenxin のパフォーマンスが大幅に向上します。したがって、Wenxin 3.0 は、プレーン テキストと大規模なナレッジ マップで構成される4 TB のコーパスをトレーニング データとして使用し、さまざまな種類の事前トレーニング タスクを使用して、モデルが貴重な語彙、構文、意味情報からより効果的に学習できるようにします。知識のレベル。その中で、事前トレーニング タスクは、自然言語理解、自然言語生成、知識抽出という 3 つのタスク パラダイムを伝播します。Wenxin 3.0 は、数ショットおよびゼロショットのタスクで以前の大型モデルよりも優れた点を示し、さまざまな指標が当時のSOTAモデルを上回り、 Super GLUEベンチマーク テストで 1 位を獲得しました。

70aaad0abf610c99545f79aceb4127eb.png

一方、ゼロショット/少数ショットにおけるChatGPTの優れたパフォーマンスは、エンティティ認識、関係抽出、イベント抽出にChatGPTを使用するなど、ナレッジ グラフ構築のプロセス全体に実際にフィードバックできます。ナレッジマップの実装プロセスにおける高コストの問題を軽減するため。

ただし、ChatGPTで遭遇する事実上の誤りと適時性の問題は、ナレッジ グラフにも存在します。ナレッジマップは、知識の更新の問題も解決する必要があります。さらに、ナレッジマップが非構造化データソースの正確性を保証できない場合、後で事実誤認が必ず発生するため、注意が必要であることは間違いありません。

2.ChatGPT +オフィスオートメーション

オフィス オートメーションのシナリオでは、次のようなChatGPTと組み合わせられたさまざまな現象レベルのアプリケーションがすでに存在します。

  • ChatPDF は、まずアップロードされたPDF を分析し、ファイル内の各段落のセマンティック インデックスを作成します。ユーザーが質問すると、ツールは関連するセグメントをChatGPTに送信し、質問と組み合わせて解釈させます。

  • ResearchGPTでは、読みたい論文のPDFやリンクを直接アップロードすると、論文の原文が表示され、右側で直接質問することができます。

  • DocsGPT は、プロジェクト ドキュメント内の情報を検索するプロセスを簡素化するツールです。強力なGPTモデルを統合することで、開発者はプロジェクトについて簡単に質問し、正確な回答を得ることができます。

  • ChatExcel、この新しいアプリケーションは、Excel に精通したアシスタントのように、自然言語を直接使用して、テーブル内のデータ情報のクエリ、変更、その他の操作を行うことができます。

ただし、これらの「ChatGPT+オフィス オートメーションツールの背後には、実際にはそれをサポートするドキュメントの標準化および正規化処理モジュールがあり、word/pdf/doc /excelなどの現在の複雑な形式のドキュメントを効果的に処理できることがはっきりとわかります。. 正規化処理、PDFのスキャン版などに使用し、これを入力として使用します。ChatGPT組み合わせることで、製品のパフォーマンスとユーザー エクスペリエンスを大幅に向上させることができます。

さて、今日はここまでです。私たちは、業界がChatGPTのテクノロジーを密接にフォローし、さまざまな関連テクノロジーと最終的なアプリケーション シナリオを組み合わせることによって、より多くの可能性を模索することを期待しています。

おすすめ

転載: blog.csdn.net/qihoo_tech/article/details/129742427