ビッグモデルの時代: ナレッジグラフは時代遅れですか? グリフィス大学およびその他の最新の「統合大規模言語モデルとナレッジ グラフ: ロードマップ」、29 ページの PDF には、最も包括的なガイドが詳しく記載されています...

ChatGPT に代表される大規模モデルは、新世代の知識表現および呼び出し方法であり、以前の知識マップ方法と比較して、より効率的、インテリジェントでスケーラブルであり、一般的な人工知能への扉を開きます。しかし、記号知識グラフは時代遅れなのでしょうか? そうではなく、知識マップと大規模モデルをうまく組み合わせることで、相互に促進し、知識活用の効果を向上させることができます。オーストラリアのグリフィス大学などの学者による「Unifying Large Language Models and Knowledge Graphs: Roadmap」(29 ページの PDF) には最も包括的なガイドが詳細に記載されており、注目に値します。

76b6d7d24dc0cbf34419cf8c3164d7e1.png

ChatGPT や GPT4 などの大規模言語モデル (LLM) は、その新たな機能と汎用性により、自然言語処理と人工知能の分野に新しい波を生み出しています。ただし、LLM はブラックボックス モデルであり、多くの場合、事実の知識を取得して入手することが困難です。対照的に、Wikipedia や Maple などのナレッジ グラフ (KG) は、豊富な事実知識を明示的に保存する構造化された知識モデルです。ナレッジ グラフは、推論と解釈のための外部知識を提供することで LLM を強化できます同時に、ナレッジ グラフは構築が難しく、進化する性質を持っているため、新しい事実を生成し、目に見えない知識をナレッジ グラフで表現する既存の方法に課題が生じます。したがって、LLM とナレッジ グラフを統合し、それぞれの強みを同時に活用することは補完的です。この記事では、LLM とナレッジ グラフの統合に向けた将来を見据えたロードマップを提案します。私たちのロードマップには 3 つの一般的なフレームワークが含まれており、1) ナレッジ グラフで拡張された LLM は、LLM の事前トレーニングおよび推論段階にナレッジ グラフを組み込み、LLM が学習した内容の理解を強化します。2) 拡張されたLLM 3) 協調的LLM + ナレッジ グラフ。LLM とナレッジ グラフは同等の役割を果たし私たちは、これら 3 つの枠組み内での既存の取り組みをロードマップにレビューおよび要約し、将来の研究の方向性を指摘します。

1 はじめに

3c626550ce52ffbf0afd52efb172476a.png

大規模なコーパスで事前学習された大規模言語モデル (LLM) (BERT [1]、RoBERTA [2]、T5 [3] など) は、次のようなさまざまな自然言語処理 (NLP) タスクのパフォーマンスで優れたパフォーマンスを示しています。質問応答 [4]、機械翻訳 [5]、テキスト生成 [6]。最近、モデル サイズの劇的な増加により、LLM の新たな機能がさらに強化され [7]、LLM を汎用人工知能 (AGI) として応用する道が開かれました。ChatGPT や PaLM2 などの高レベル LLM は、数十億のパラメーターを備えており、教育 [8]、コード生成 [9]、推奨事項 [10] など、多くの複雑な実践的なタスクにおいて大きな可能性を示しています。

LLM は多くのアプリケーションで成功を収めていますが、事実に関する知識が不足していると批判されています。具体的には、LLM はトレーニング コーパスに含まれる事実と知識を記憶します [14]しかし、さらなる研究により、LLM は事実を思い出すことができず、しばしば幻覚を起こし、事実に誤りのある主張を生み出すことが明らかになりました [15]、[28]。たとえば、「アインシュタインはいつ重力を発見しましたか?」と尋ねられたとき、LLM は、アイザック ニュートンが重力の矛盾理論を定式化したという事実に反して、「アインシュタインは 1687 年に重力を発見した」と答えるかもしれません。この問題はLLMの信頼性を大きく傷つけます。

ブラックボックスモデルとして、LLM は解釈可能性の欠如でも批判されています。LLM はパラメータ内の知識を暗黙的に表しますLLM が取得した知識を解釈したり検証したりすることは困難です。さらに、LLM は確率モデルを通じて推論を実行しますが、これは不確実なプロセスです [16]。LLM が予測や決定を導き出すために使用する特定のパターンや関数は、人間が直接アクセスしたり解釈したりすることはできません [17]。一部の LLM は思考連鎖を適用することで予測を説明しますが [29]、その推論的解釈は幻覚の問題にも悩まされます [30]。これは、医療診断や法的判断などの高リスクのシナリオでの LLM の適用に深刻な影響を与えます。たとえば、医療診断のシナリオでは、LLM が病気を誤診し、一般的な医学知識と矛盾する説明を行う可能性があります。これは、一般的なコーパスでトレーニングされた LLM が、ドメイン固有の知識や新しいトレーニング データの欠如により、特定のドメインや新しい知識にうまく一般化できない可能性があるという別の問題を引き起こします [18]。

上記の問題を解決するには、ナレッジ グラフ (KG) を LLM に組み込むことが考えられます。ナレッジ グラフ (KG) は、トリプル (先頭エンティティ、関係、末尾エンティティ) の形式で大量のファクトを保存し、知識を表現するための構造化された決定論的な方法です (例: Wikidata [20]、YAGO [31]、およびネル [32])KG は正確な形式的知識を提供するため、さまざまなアプリケーションにとって重要です [19]。さらに、彼らは、解釈可能な結果を​​生成できる象徴的推論能力 [22] でも有名です。KG は、新しい知識を継続的に追加することで積極的に進化することもできます [24]。さらに、専門家はドメイン固有の KG を構築して、正確で信頼できるドメイン固有の知識を提供できます [23]。しかし、KG は構築が難しく [33]、KG の現在の方法 [25]、[27]、[34] では、現実世界の KG の不完全で動的に変化する性質に対処するには不十分です。これらの方法では、目に見えないエンティティを効果的にモデル化し、新しい事実を表現することができません。さらに、KG 内の豊富なテキスト情報を無視することがよくあります。さらに、KG の既存のメソッドは通常、特定の KG またはタスクに合わせて調整されており、十分に一般的ではありません。したがって、KG が直面する課題を解決するために LLM を活用することも必要です。LLM と KG の長所と短所をそれぞれ図 1 にまとめます。

最近、LLM と KG を統合する可能性について、研究者や実務家からの注目が高まっています。LLM と KG は本質的に相互に関係しており、相互に強化し合うことができますKG 拡張 LLM では、KG を LLM の事前トレーニングおよび推論段階に統合して外部知識 [35] ~ [37] を提供できるだけでなく、LLM を分析して解釈可能性を提供するためにも使用できます [14]、[38] ]、[39]。LLM で拡張された KG の中で、LLM は、KG 埋め込み [40]、KG 補完 [26]、KG 構築 [41]、KG からテキストへの生成 [42]、KGQA [ 43] KG のパフォーマンスを向上させ、KG の適用を容易にします。相乗的 LLM+KG では、研究者は LLM と KG の利点を組み合わせて、知識表現 [44] と推論 [45]、[46] のパフォーマンスを相互に強化します。知識拡張 LLM に関する調査 [47] ~ [49] はいくつかありますが、これらは主に KG を外部知識として使用して LLM を強化することに焦点を当てていますが、KG を統合するための他の可能性や、KG アプリケーションにおける LLM の潜在的な役割は無視されています。 。

この記事では、LLM と KG を統合し、それぞれの強みを活用し、さまざまな下流タスクに対するさまざまな方法の制限を克服するための将来を見据えたロードマップを提案します私たちは詳細な分類法を提案し、包括的なレビューを実施し、これらの急速に発展する分野における新たな方向性を指摘します。私たちの主な貢献は次のとおりです。

  1. 道路地図私たちは、LLM と KG を統合するための将来を見据えたロードマップを提案します。当社のロードマップには、LLM と KG を統合するための 3 つの一般的なフレームワーク、つまり KG 拡張 LLM、LLM 拡張 KG、相乗的 LLM+KG が含まれており、これら 2 つの異なるが補完的な技術を統合するためのガイダンスを提供します。

  2. 分類とレビュー私たちのロードマップの統合フレームワークごとに、詳細な分類法と、LLM と KG の研究を統合する新しい分類法を提案します。各カテゴリ内で、さまざまな統合戦略とタスクの観点から研究をレビューし、各フレームワークに対する追加の洞察を提供します。

  3. 新たな進歩についての報道LLM と KG の高度なテクニックについて説明します。ChatGPT や GPT-4 などの最先端の LLM だけでなく、マルチモーダル ナレッジ グラフなどの新しい KG についても説明します。

  4. 課題と今後の方向性のまとめ既存の研究における課題を強調し、将来の研究に向けたいくつかの有望な方向性を提案します。

2. 背景知識

このセクションでは、まずいくつかの代表的な大規模言語モデル (LLM) を簡単に紹介し、LLM をさまざまなアプリケーションに効果的に使用するヒント エンジニアリングについて説明します。次に、ナレッジ グラフ (KG) の概念を説明し、KG のさまざまなカテゴリを紹介します。

大規模な言語モデル

大規模なコーパスで事前トレーニングされた大規模言語モデル (LLM) は、さまざまな NLP タスクにおいて大きな可能性を示しています [13]。図 3 に示すように、ほとんどの LLM は、セルフ アテンション メカニズムを搭載したエンコーダおよびデコーダ モジュールで構成される Transformer 設計 [50] に由来しています。アーキテクチャ構造に従って、LLM は 3 つのグループに分類できます。1) エンコーダ専用 LLM、2) エンコーダ/デコーダ LLM、3) デコーダ専用 LLM。図 2 に示すように、モデル アーキテクチャ、モデル サイズ、オープンソースの可用性が異なるいくつかの代表的な LLM をまとめています。

f00bd12a922156793ccb676c872e470f.png

チップワークス

ヒント エンジニアリングは、さまざまなアプリケーションや研究領域で大規模言語モデル (LLM) の有用性を最大化するためのヒントの作成と洗練に焦点を当てた新興分野です [63]。図 4 に示すように、キューは、LLM のタスク (感情分類など) を指定する自然言語入力シーケンスです。プロンプトには、1) 指示、2) コンテキスト、3) 入力テキストという複数の要素が含まれる場合があります。指示は、モデルに特定のタスクを実行するように指示する短い文です。Context は、入力テキストまたはいくつかの例のコンテキストを提供します。入力テキストは、モデルによって処理される必要があるテキストです。ヒント エンジニアリングは、質問応答、感情分類、常識的推論など、さまざまな複雑なタスクにおける大規模な言語モデル (ChatGPT など) の機能を向上させることを目指しています。Chain of Thinking (CoT) プロンプト [64] は、中間の推論ステップを通じて複雑な推論能力を可能にします。Liu et al. [65] は、外部の知識を組み込んで、より優れた知識拡張ヒントを設計しています。Automated Prompt Engineer (APE) は、LLM のパフォーマンスを向上させるための自動ヒント生成方法を提案しました [66]。ヒントは、微調整を行わずに LLM の可能性を活用する簡単な方法を提供します。プロンプト エンジニアリングに習熟すると、LLM の長所と短所をより深く理解できるようになります。

864ca7286ab25c4ac44ee20e4fe247c7.png

ナレッジ グラフ (KG) ナレッジ グラフ (KG) は、構造化された知識を一連のトリプル KG = {(h, r, t) ⊆ E × R × E} として保存します。ここで、E と R はそれぞれエンティティと関係のセットを表します。既存のナレッジ グラフ (KG) は、保存されている情報に応じて、1) 百科事典 KG、2) 一般知識 KG、3) ドメイン固有 KG、および 4) マルチモーダル KG の 4 つのグループに分類できます。図 5 に、さまざまなクラスの KG の例を示します。

8dd1b44a7dcd819aedf3dcf0b30d3a1a.png

 応用 

LLM と KG は、現実世界のさまざまなアプリケーションで広く使用されています。LLM と KG を使用したいくつかの代表的なアプリケーションを表 1 にまとめます。ChatGPT/GPT-4 は、自然な会話形式で人間とコミュニケーションできる LLM ベースのチャットボットです。LLM の知識認識を向上させるために、ERNIE 3.0 と Bard は KG をチャットボット アプリケーションに統合しました。Firefly は、ユーザーが自然言語の説明を使用して写真を編集できる写真編集アプリを開発しました。Copilot、New Bing、Shop.ai はそれぞれ、コーディング アシスタント、Web 検索、レコメンデーションなどの分野でアプリケーションを強化するために LLM を採用しています。Wikidata と KO は、外部知識を提供するために使用される 2 つの代表的なナレッジ グラフ アプリケーションです。AliOpenKG は、推奨を目的として設計されたナレッジ グラフです。Doctor.ai は、LLM と KG を統合して医療アドバイスを提供するヘルスケア アシスタントを開発しました。

73f00ed3b6023e06a64a59fe403e6b63.png

3 ロードマップと分類 

このセクションでは、まず LLM と KG を統合するための明確なフレームワーク ロードマップを提案します。次に、LLM と KG の統合に関する研究の分類を示します。 

3.1 ロードマップ 

図 6 に、KG と LLM を統合するためのロードマップを示します。ロードマップでは、LLM と KG を統合するための 3 つのフレームワーク (KG 拡張 LLM、LLM 拡張 KG、および相乗的 LLM + KG を含む) を特定しました。

48634f8fae2764914b904598324cf950.png

3.1.1 KG 拡張 LLM 

LLM は、大規模なコーパスから知識を学習し、さまざまな自然言語処理 (NLP) タスクで最先端のパフォーマンスを達成する能力で知られています。しかし、LLM は幻覚の問題 [15] や解釈可能性の欠如によってしばしば批判されます。これらの問題に対処するために、研究者らは、LLM をナレッジ グラフ (KG) で強化することを提案しました。KG は大量の知識を明示的かつ構造化された方法で保存しており、LLM の知識認識を強化するために使用できます。一部の研究者は、LLM が KG から知識を学ぶのに役立つ、トレーニング前の段階で KG を LLM に組み込むことを提案しています [91]、[92]。他の研究者は、推論段階で KG を LLM に組み込むことを提案しました。KG から知識を取得することにより、ドメイン固有の知識を取得する LLM のパフォーマンスを大幅に向上させることができます [93]。LLM の解釈可能性を向上させるために、研究者は LLM の事実 [14] や推論プロセス [94] を説明するために KG も利用します。

3.1.2 LLM によって強化された KG

ナレッジ グラフ (KG) は構造化された知識を保存し、多くの実際のアプリケーションで重要な役割を果たします [19]。しかし、既存の KG 方法には、不完全な KG の処理 [25] および KG を構築するためのテキスト コーパスの処理 [95] において欠点があります。LLM の一般化能力を考慮して、多くの研究者が KG 関連のタスクを解決するために LLM を利用しようとしています。最も簡単な方法は、LLM を KG 関連タスクのテキスト エンコーダとして使用することです。研究者は、LLM を利用して KG 内のテキスト コーパスを処理し、テキストの表現を使用して KG の表現を強化しています [96]。一部の研究では、LLM を使用して元のコーパスを処理し、KG 構築のための関係とエンティティを抽出しています [97]。最近の研究の中には、構造化された KG を LLM が理解できる形式に効率的に変換できる KG ヒントの設計を試みたものもあります。このようにして、LLM は、KG 完了 [98] や KG 推論 [99] などの KG 関連タスクに直接適用できます。

53a50a19934191aacdd37ed9e1717371.png

3.1.3 LLMとKGを統合したシステム 

近年、研究者らはLLMとKGを組み合わせる可能性にますます注目を集めています[40]、[42]。LLM と KG は本質的に補完的な 2 つの技術であり、相互に強化するために共通のフレームワークに統合する必要があります。この統合をさらに検討するために、図 7 で LLM と KG を融合した統合フレームワークを提案します。この統合フレームワークは、1) データ、2) 融合モデル、3) テクノロジー、4) アプリケーションの 4 つの層で構成されます。データ層では、LLM と KG を使用して、それぞれテキストと構造化データを処理します。マルチモーダル LLM [100] および KG [101] の開発により、このフレームワークはビデオ、オーディオ、画像などのマルチモーダル データを処理できるように拡張できます。融合モデル層では、LLM と KG が相互に協力して機能を向上させることができます。技術レベルでは、LLM および KG ですでに使用されている関連技術をこのフレームワークに組み込んで、パフォーマンスをさらに向上させることができます。アプリケーション層では、LLM と KG を統合して、検索エンジン [102]、レコメンダー システム [10]、AI アシスタント [103] などのさまざまな実用的なアプリケーションに対処できます。

046bffba0ba2c607c0880c8271a98c8d.png

3.2 分類 

大規模言語モデル (LLM) とナレッジ グラフ (KG) の統合に関する研究をより深く理解するために、ロードマップ内の各フレームワークに対してより詳細な分類を提供します。具体的には、ナレッジ グラフと大規模言語モデルを統合するさまざまな方法、つまり、ナレッジ グラフによって拡張された大規模言語モデル、ナレッジ グラフの増分を伴う大規模言語モデル、および大規模言語モデルを融合するシステムに焦点を当てます。そしてナレッジグラフ。研究の詳細な分類を図 8 に示します。

ナレッジ グラフで強化された大規模な言語モデル。ナレッジ グラフを統合すると、さまざまな下流タスクにおける大規模な言語モデルのパフォーマンスと解釈可能性が向上します。ナレッジ グラフによって拡張された大規模言語モデルの研究を 3 つのグループに分けます。 1) ナレッジ グラフによって拡張された大規模言語モデルの事前トレーニングには、トレーニング前の段階でナレッジ グラフを適用し、知識を向上させる作業が含まれます。大規模な言語モデルの表現。2) ナレッジグラフによって強化された大規模言語モデルの推論には、大規模言語モデルの推論段階でナレッジグラフを使用する研究が含まれており、これにより大規模言語モデルが再トレーニングすることなく最先端の知識を取得できるようになります。3) ナレッジグラフによって強化された大規模言語モデルの解釈可能性には、ナレッジグラフを使用して大規模言語モデルによって学習された知識を理解し、大規模言語モデルの推論プロセスを説明する作業が含まれます。

大規模な言語モデルの増分のナレッジ グラフ。大規模な言語モデルを適用して、ナレッジ グラフに関連するさまざまなタスクを強化できます。私たちは、大規模言語モデルの増分に関する KG 研究を、タスクの種類に応じて 5 つのグループに分類します。 1) 大規模言語モデルによって強化された KG 埋め込みには、大規模言語モデルを使用して、テキスト記述をエンコードすることによってナレッジ グラフの表現を強化することが含まれます。エンティティと関係の。2) Large Language Model Enhanced Knowledge Graph Completion には、大規模言語モデルを使用してテキストをエンコードしたり、ファクトを生成して Knowledge Graph Completion (KGC) のパフォーマンスを向上させる論文が含まれています。3) 大規模言語モデルで強化されたナレッジ グラフの構築には、大規模言語モデルを使用してエンティティの発見、共参照の解決、およびナレッジ グラフを構築するための関係抽出タスクを処理する作業が含まれます。4) 大規模言語モデルで強化されたナレッジ グラフからテキストへの生成には、大規模言語モデルを使用してナレッジ グラフから記述を生成することが含まれます。

4 今後の方向性 

前のセクションでは、ナレッジ グラフ (KG) と大規模言語モデル (LLM) の統合における最近の進捗状況を確認しましたが、解決すべき課題や未解決の問題がまだ多くあります。このセクションでは、この研究分野の今後の方向性について説明します。

  • ナレッジグラフ (KG) を使用した大規模言語モデル (LLM) でのイリュージョン検出 

  • LLM のナレッジを編集するためのナレッジ グラフ (KG) 

  • ブラックボックスLLMへのナレッジ注入のためのナレッジグラフ(KG) 

  • ナレッジ グラフ (KG) 用のマルチモーダル LLM 

  • ナレッジグラフ構造を理解するための LLM 

  • 双方向推論のための LLM と KG の融合。

5。結論 

大規模言語モデル (LLM) とナレッジ グラフ (KG) を統合することは、学術界や産業界からますます注目を集めている積極的な研究の方向性です。この論文では、この分野における最近の研究の包括的な概要を提供します。まず、LLM を強化するために KG を統合するさまざまな方法を紹介します。次に、LLM を KG に適用するための既存の方法を導入し、さまざまな KG タスクに基づいて分類を構築します。最後に、この分野における課題と将来の方向性について説明します。この論文がこの分野の包括的な理解を提供し、今後の研究の動機付けになれば幸いです。

専門知識と便利な閲覧

ダウンロードは簡単です。Zhuozhiパブリックアカウントにご注意ください(上の青いZhuozhi注意をクリックてください)

  • バックグラウンドで返信するか、メッセージ「LLMG」を送信すると、「大規模モデルの時代: ナレッジ グラフは廃止されましたか?」が表示されます。グリフィス大学およびその他の最新の「統合大規模言語モデルとナレッジ グラフ: ロードマップ」、最も完全なガイドを詳しく説明した 29 ページの PDF専門知識のダウンロード リンク

5993ae51462564c159e8c46a66f20b96.gif

特別な知識、専門的で信頼できる人工知能の知識の配布により、認知コラボレーションがより速く、より良くなります。Zhuanzhi www.zhuanzhi.aiに登録してログインして、100,000 +AI (AI と軍事、医療、公安など) をテーマにした乾物知識資料を入手してください。

da62f95be19818795daab598f8ef8f81.jpeg

WeChatをスキャンして、専門家人工知能知識惑星グループに参加し、最新のAI専門乾物知識チュートリアル資料を入手し、専門家と相談を交換してください

c4405257f98181c21f276ed49ed8237e.jpeg

原文を読む」をクリックして専門知識の活用方法を学び10万件の+AI主題知識資料を閲覧・入手してください

おすすめ

転載: blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/131355899