中国科学技術大学が提案: LLM の個別化された概要、大規模モデルと個別化の課題と機会を詳しく説明

a8c514975a50889c73bb865455d17456.png

出典: 専門知識

NLP グループに入る —> NLP 交換グループに参加する

大規模な言語モデルの出現は、人工知能の分野における革命的な進歩を示しています。前例のないトレーニング スケールとモデル パラメーターのおかげで、大規模な言語モデルの機能が大幅に向上し、理解、言語合成、常識的推論において人間のようなパフォーマンスを実現しました一般的な AI 機能におけるこの大きな飛躍は、パーソナライズされたサービスの実装方法を根本的に変えることになります。

まず、人間がパーソナライズされたシステムと対話する方法が変わります従来のレコメンダー システムや検索エンジンのような受動的な情報フィルタリング メディアではなく、大規模な言語モデルが積極的なユーザー エンゲージメントの基盤を提供します。このような新しい基盤に基づいて、ユーザーのリクエストを積極的に検討し、ユーザーが必要とする情報を自然でインタラクティブかつ解釈可能な方法で提供することができます。

第二に、パーソナライズされたサービスの範囲も大幅に拡大し、単にパーソナライズされた情報を収集することから、パーソナライズされたサービスの複合機能を提供するものに発展します大規模な言語モデルを共通インターフェイスとして利用することで、パーソナライゼーション システムはユーザーのリクエストをプランにコンパイルし、外部ツール (検索エンジン、計算機、サービス API など) の機能を呼び出してこれらのプランを実行し、その出力を統合できます。これらのツールを使用して、エンドツーエンドのパーソナライゼーション タスクを完了します。現在、大規模な言語モデルは依然として急速に開発されており、パーソナライゼーション アプリケーションではほとんど解明されていないままです。

したがって、パーソナライゼーションの課題と、大規模な言語モデルを使用してそれに対処する機会を検討する時期が来たと私たちは考えています。特に、この将来を見据えた文書は、既存のパーソナライゼーション システムの開発と課題、大規模な言語モデルの新たな機能、およびパーソナライゼーションに大規模な言語モデルを活用する潜在的な方法に捧げます

大規模言語モデル [1] の出現により、人間の表現の理解において目覚ましい進歩が見られ、AI コミュニティに大きな影響を与えました膨大な量のデータと大規模なニューラル ネットワークを備えたこれらのモデルは、人間の言語を理解し、人間の言語に似たテキストを生成する際に驚くべき能力を示します。機能の中には、推論 [2]、少数ショット学習 [3]、および事前トレーニング済みモデルへの大量の世界知識の組み込み [1] などがあります。これは人工知能の分野における大きな進歩を示し、機械との対話に革命をもたらします。その結果、大規模な言語モデルは、自然言語処理や機械翻訳からクリエイティブなコンテンツ生成やチャットボット開発に至るまでのアプリケーションに不可欠なものとなっています。特に、ChatGPT の立ち上げは人類コミュニティから多くの注目を集めており、大規模な言語モデルの変革力と、AI が達成できる限界を押し上げる可能性についての考察を促しています。この破壊的なテクノロジーは、数え切れないほどの領域で AI と関わり、活用する方法を変え、新たな可能性とイノベーションの機会を開くことを約束します。これらの言語モデルは進歩と発展を続けるにつれて、人工知能の未来を形作ることを約束し、私たちが未知の領域を探索し、人間と機械のコラボレーションにおけるより大きな可能性を解き放つことを可能にします。

パーソナライゼーションは、個人の好みに合わせてエクスペリエンスを調整する技術であり、人間と機械の間のギャップを埋める重要かつ動的なリンクです今日のテクノロジー主導の世界では、パーソナライゼーションは、さまざまなデジタル プラットフォームやサービスとのユーザー インタラクションやエンゲージメントを強化する上で重要な役割を果たしています。パーソナライゼーション システムは、個人の好みに適応することで、マシンに各ユーザー固有のニーズを満たす機能を提供し、対話をより効率的かつ楽しいものにします。さらに、パーソナライゼーションは単なるコンテンツの推奨ではなく、ユーザー インターフェイス、コミュニケーション スタイルなどを含むユーザー エクスペリエンスのあらゆる側面を含みます。人工知能が進化し続けるにつれて、大量のインタラクションと多様なユーザーの意図を処理する上で、パーソナライゼーションはますます複雑になっています。そのため、複雑なシナリオに対処し、より楽しく満足のいく体験を提供するために、より高度なテクノロジーを開発する必要があります。パーソナライゼーションの向上への探求は、ユーザーをより深く理解し、変化するニーズに応えたいという欲求によって引き起こされます。テクノロジーの発展に伴い、パーソナライゼーション システムは今後も進化し、最終的には人間とコンピューターの対話が私たちの生活のあらゆる側面にシームレスに統合され、パーソナライズされ、カスタマイズされたエクスペリエンスが日常生活に提供される未来が生まれると考えられます。

大規模な言語モデルは、その深く幅広い機能を備えており、パーソナライゼーション システムに革命をもたらし、人間の対話方法を変え、パーソナライゼーションの範囲を拡大する可能性があります人間と機械の間のインタラクションは、従来の検索エンジンやレコメンダー システムのように、能動的と受動的に分類することしかできなくなりました。しかし、これらの大規模な言語モデルは、単純な情報フィルタリングにとどまらず、さまざまな追加機能も提供します。具体的には、システムはユーザーの意図を積極的かつ包括的に探索し、自然言語を介したユーザーとシステム間のより直接的かつシームレスなコミュニケーションを可能にします。抽象的で解釈が難しい ID ベースの情報表現に依存する従来の技術とは異なり、大規模な言語モデルにより、ユーザーの正確なニーズや興味をより深く理解できるようになります。このより深い理解により、よりきめ細かく効率的な方法でユーザーのニーズや好みを満たす高品質のパーソナライズされたサービスへの道が開かれます。さらに、大規模な言語モデルの機能によってさまざまなツールの統合が大幅に強化され、パーソナライズされたシステムの可能性とアプリケーション シナリオが大幅に拡張されました。ユーザーのニーズを理解、生成、実行するなどの計画に変換することで、ユーザーはさまざまな情報やサービスにアクセスできるようになります。重要なのは、ユーザーはシームレスなエンドツーエンド モデルを体験しているため、舞台裏で行われている複雑な移行プロセスに気付かないことです。この観点からすると、パーソナライゼーションのための大規模な言語モデルの可能性は十分に検討されていません。

このペーパーでは、パーソナライゼーションにおける課題を調査し、大規模な言語モデルを使用した潜在的な解決策を探ります既存の関連研究では、LaMP [4] は、情報検索システムでパーソナライズされた出力を生成するための言語モデルのトレーニングと評価のための新しいベンチマークを導入しています。一方、他の関連調査 [5]、[6]、[7] は主に、レコメンダー システムなどの従来のパーソナライゼーション技術に焦点を当てています。LLM4Rec [5] は、学習メカニズムの観点から、推奨のための識別 LLM と推奨のための生成 LLM を深く研究しています。LLM を推奨システムに「どこで」「どのように」適応させるかに関して、Li ら [6] は業界の推奨段階のプロセス全体に焦点を当てています。一方、Fan ら [7] は、事前トレーニング、微調整、およびヒントの方法に焦点を当てたレビューを実施しました。これらの研究では、分析を容易にするために Bert や GPT などの事前トレーニング済み言語モデルについて説明していますが、大規模な言語モデルの新たな機能には限定的に注意を払っています。このペーパーは、パーソナライゼーションのコンテキストで大規模な言語モデルのユニークで強力な機能を調査することでこのギャップを埋め、ツールを使用してパーソナライゼーションの範囲をさらに拡大することを目的としています。

4a4ffd6d48b312dc78ee209fa0629736.png

このレビューの残りの部分は次のように構成されています。セクション 2 でパーソナライズされた大規模な言語モデルをレビューし、その開発と課題の概要を説明します。次に、セクション 3 で、新しい機能の単純な活用から他のツールとの複雑な統合に至るまで、パーソナライゼーションにおける大規模な言語モデルの潜在的な役割について注意深く説明します。また、大規模な言語モデルをパーソナライゼーションに適応させる際に起こり得る課題についても説明します。

パーソナライゼーションのための大規模な言語モデル

以下のセクションでは、語彙知識を機能として利用するなどの単純な使用シナリオから、プロキシの役割として機能できるようにする他のツール モジュールとのより複雑な統合まで、パーソナライゼーションのための大規模な言語モデルの可能性を詳しく掘り下げます。具体的には、基本的な世界知識とユーザーの意図の理解から始まり、高度な推論能力に進む、新たな能力の進歩に焦点を当てています。私たちは、大規模な言語モデルがさまざまな項目に関する一般知識を豊かにする知識ベースの構築にどのように役立つかを探ります。さらに、大規模な言語モデルの理解能力がコンテンツの説明者や説明者にインタラクションの詳細な分析をどのように提供するかについて説明します。さらに、大規模な言語モデルの推論機能を活用して、推奨結果をシステム推論者に提供しようとする試みも観察されています。これらのますます洗練された機能により、大規模な言語モデルやその他のツール モジュールを高度に利用して、ユーザーの意図をより深く理解し、ユーザーの指示を満たすことが可能になります。したがって、私たちは、大規模な言語モデルと、ツール学習、会話エージェント、パーソナライズされたコンテンツ クリエーターなどの他のパーソナライゼーション ツールとの統合も検討しています。この章の概要を図 1 に示します。私たちの包括的な調査は、現在の状況をより深く理解し、大規模な言語モデルをパーソナライゼーションに統合することによってもたらされる機会と課題に光を当てることを目的としています。

知識ベースとしてのビッグモデル

明示的な知識ベースとして事実の知識を取得する大規模言語モデル (LLM) の機能 [38]、[39]、[40]、[41]、[42]、[43]、[40]、[41]、 [44]、[45]、[46] は広範な議論を引き起こし、レコメンダー システム内でより包括的なナレッジ グラフを構築する機会を提供します。[38] の研究に遡ると、大規模な言語モデルは、エンティティや常識などの事実情報を保存し、下流のタスクに常識を確実に転送するという優れた能力を実証してきました。既存のナレッジ マップ手法は、不完全な KG を処理することが難しく [47]、テキスト コーパスを使用して KG を構築することが困難です [48]。多くの研究者は、これら 2 つのタスク、つまりナレッジ マップの完成 [49] と LLM の機能を使用して解決しようとしています。ナレッジグラフの構築 [50]。ナレッジ グラフの補完 (特定のナレッジ グラフ内で欠落しているファクトを補うタスクを指します) については、最近の取り組みはテキストのエンコードやナレッジ グラフのファクトの生成に注がれています。MTL-KGC [51] は、タプルの可能性を予測するためにテキスト シーケンスをエンコードします。MEMKGC [52] は、トリプレットのマスクされたエンティティを予測します。StAR [53] は、シャム テキスト エンコーダを使用してエンティティを個別にエンコードします。GenKGC [54] は、デコーダのみの言語モデルを使用して末尾エンティティを直接生成します。TagReal [55] は、外部テキスト コーパスから高品質のプロンプトを生成します。AutoKG [48] は、ChatGPT や GPT-4 などの LLM を直接採用し、末尾エンティティを予測するためのカスタム ヒントを設計しました。もう 1 つの重要なタスクであるナレッジ グラフ構築 (知識の構造化表現の作成を意味します) に関しては、LLM はエンティティ発見 [56]、[57]、共参照解決 [58]、[ [59]および関係抽出[60]、[61]。LLM はエンドツーエンドの構築も実現できます [62]、[50]、[42]、[63]、[55]、生のテキストから直接 KG を構築します。LLM を使用すると、知識を抽出してナレッジ グラフを構築できます。symbolic-kg [64] は GPT3 から常識的な事実を抽出し、小さな学生モデルを微調整してナレッジ グラフを生成します。これらのモデルは、大量の知識を保存する能力を実証しており、ナレッジ グラフの範囲と深さを増やすための実行可能なオプションを提供します。さらに、これらの進歩により、人間による監視の必要性を排除し、保存された知識を LLM からナレッジ グラフに直接転送する研究が促進されました。この興味深い研究は、最先端の大規模言語モデルを使用したナレッジ グラフの自動補完の可能性を明らかにしています。

コンテンツインタープリタとしての LLM 

コンテンツベースのレコメンダーは、レコメンダー システムのまばらなフィードバックの問題を軽減する効果的なソリューションを提供します。アイテムの属性や特性を活用することで、これらのシステムはアイテムの属性をより深く理解し、ユーザーの好みと正確にマッチングすることができます。ただし、コンテンツベースのレコメンデーションで使用されるコンテンツの特徴も、スパース性を示す場合があります。クリックやビューなどの推奨される監視シグナルのみに依存すると、これらの機能の潜在的な利点を十分に活用できない可能性があります。この課題を克服するために、テキストの特徴を処理しながらコンテンツ インタプリタとして機能する強力な基本アルゴリズムとして言語モデルが登場しました。これらを利用すると、レコメンダー システムの有効性が高まり、テキスト コンテンツを効果的に理解して解釈できるようになり、レコメンデーションが向上します。

5e52cdc61d787498199280a5f377116a.png

結論は

全体として、大規模な言語モデルの出現は、人工知能の分野における大きな進歩を表しています。理解力、言語分析、常識的推論における強化された能力により、パーソナライゼーションの新たな可能性が開かれます。このペーパーでは、大規模な言語モデルをパーソナライゼーション システムに適応させるタイミングについて、いくつかの観点から説明します。私たちは、この進歩が、パフォーマンスを向上させるために大規模な言語モデルの低レベル機能を活用することから、外部ツールとの複雑な対話におけるエンドツーエンドのタスクの可能性を活用することに進化していることを観察しました。この進化は、パーソナライズされたサービスの提供方法に革命をもたらすことを約束します。また、大規模な言語モデルをパーソナライゼーション システムに統合するという未解決の課題があることも認識しています。

471e459d6a22626f24e2e1014f09dc0b.png


NLP グループに入る —> NLP 交換グループに参加する

おすすめ

転載: blog.csdn.net/qq_27590277/article/details/132399884