TKDE 2020 |レビュー:知識グラフに基づくレコメンデーションシステム

TKDE 2020

レビュー:知識グラフに基づくレコメンデーションシステム

知識グラフベースのレコメンダーシステムに関する調査

中国科学院計算技術研究所、百度、香港科技大学、中国科学技術大学、マイクロソフト

元の

Qingyu Guo、Fuzhen Zhuang、Chuan Qin、Hengshu Zhu、Xing Xie、Hui Xiong、Qing He、 

知識グラフベースのレコメンダーシステムに関する調査、 

知識とデータエンジニアリングに関するIEEEトランザクション(IEEE TKDE)、2020年

土井:10.1109 /TKDE.2020.3028705。

この記事は、中国科学院の計算技術研究所、百度、香港科技大学、中国科学技術大学、およびマイクロソフトの学者によってTKDE-2020で公開された作品です[1]。この作業は、チームが「中国の科学:情報科学」[2]で公開した中国のレビューペーパーに基づいており、近年の知識グラフに基づくレコメンデーションシステムの関連作業をさらに包括的に要約し、コアキーアルゴリズムを拡張します。この記事の紹介と比較分析では、関連する知識グラフデータを要約しました。また、さまざまな知識グラフベースの推奨システムと対応するオプションのベンチマークデータセットの既存のアプリケーションシナリオを要約しました。最後に、フィールドの将来の開発を実行しました。特定の前向きな議論は、この分野の将来の研究にとって特定の指針となる重要性を持っています。

1はじめに 

インターネットの急速な発展により、私たちは情報爆発の時代にいます。インターネットの利便性を享受しながら、情報過多の問題も抱えており、膨大なデータから必要な情報を迅速に抽出することは困難です。この問題を解決するために、レコメンデーションシステムが誕生し、音楽、映画、ショッピングなど多くのシーンに実装され、ユーザーエクスペリエンスが向上しました。

最近、知識グラフを利用したレコメンデーションシステムが研究者の注目を集めており、補助情報の一種としてナレッジグラフをレコメンデーションシステムに導入することが基本的な考え方です。この方法は、レコメンデーションシステムの精度を向上させるだけでなく、レコメンデーション結果の説明も提供します。一方では、ナレッジグラフは異種の有向情報ネットワークであり、ノードはエンティティを表し、有向エッジはエンティティ間の関係を表すことができます。ナレッジグラフには、レコメンデーションシステムのアイテムに関する背景情報が大量に含まれており、アイテム間のさまざまな関係を表すことができます。同時に、レコメンデーションシステム内のユーザーとアイテム間のインタラクションデータを組み合わせて、ユーザーとアイテム間の隠れた接続関係を拡張し、ユーザーの好みをより正確にモデル化し、レコメンデーション効果を向上させることもできます。次の図は、ユーザー、映画、俳優、監督、テーマのエンティティだけでなく、エンティティ間の複雑な関係も含むナレッジグラフに基づく推奨例です。映画「アバター」、「ブラッドダイアモンド」、ユーザーのボブは、知識グラフに隠された関係の助けを借りて接続され、システムが正確な推奨を行うのを支援します。一方、ナレッジグラフは、推奨結果を追跡可能にします。たとえば、図の関係シーケンスから、「アバター」をボブに推薦する理由の1つは、「アバター」とボブが見た星間交差点が両方ともSF映画であることがわかります。

  図1知識グラフに基づく推奨の例  

このレビューの目的は、知識グラフをレコメンデーションに使用する現在の研究状況を要約して説明することです。この作業は、グラフベースのレコメンデーションシステムのレビューや知識グラフアプリケーションのレビューなど、以前の作業と重複しています。前の作業と比較して、メソッドの概要はより詳細であり、より詳細な階層的な技術分類を提供します。まず、この分野の記事を、埋め込みベースの方法、接続ベースの方法、および伝播ベースの方法の3つのカテゴリに分類します。同時に、各タイプのメソッドの特性に応じて、より詳細な区分が提供されます。この記事の2番目の貢献は、知識グラフが推奨結果の解釈可能性をどのように提供するかについて詳しく説明し、さまざまな技術的方法を要約したことです。同時に、レコメンデーションシステムのアプリケーションシナリオを分類の基礎として使用し、さまざまなアプリケーションで使用できるデータセットを要約します。最後に、この分野の理解に基づいて、将来の発展のためのいくつかの見通しを提示します。

2.メソッドの概要 

知識グラフの使用に応じて、既存の作業を3つのカテゴリに分類します。埋め込みベースの方法、接続ベースの方法、および伝播ベースの方法です。方法の種類ごとに、さらに分割し、紹介する代表的な作品をリストアップしました。調査した記事を次の表にまとめ、まとめた分類基準に従って各方法を分類し、各作業の知識グラフの作成方法、グラフ埋め込みの方法、および解決すべき主な問題を分類しました。読者の利便性チェックアウト。

  表1.メソッドの概要   

 2.1 

埋め込み方式

埋め込みベースの方法は、主にナレッジグラフの豊富なセマンティック関係を使用して、オブジェクトとユーザーの表現を充実させます。このタイプのメソッドは、主に2つの部分で構成されます。グラフ埋め込みモジュールは主にグラフ埋め込みメソッドを使用してナレッジグラフ内のエンティティと関係の表現を学習し、推奨モジュールはアイテムのユーザー設定をモデル化します。これら2つのモジュールの組み合わせにより、この方向の作業は3つのカテゴリに分類できます。最初のタイプは順次学習です。最初に、グラフ埋め込みアルゴリズムを使用してグラフ埋め込みモジュールを個別にトレーニングし、次に事前トレーニングされた知識グラフ表現ベクトルを推奨システムに導入して、ユーザーとアイテムの言語表現を拡張します。次に、推奨モジュールがトレーニングされます。作業には、DKN、KSR、KTGANなどが含まれます。2番目のアイデアは、グラフ埋め込みモジュールと推奨モジュールの目的機能を組み合わせてエンドツーエンドのトレーニングを実現する共同学習です。作業にはCKE、CFKGなどが含まれます。3番目のアイデアは、マルチタスク学習フレームワークを導入することです。グラフ埋め込みモジュールを、知識グラフの完成やエッジ予測など、推奨モジュールに関連して分離されたタスクに設計することによってタスクでは、グラフ埋め込みモジュールを使用して、推奨モジュールのトレーニングプロセスを監視します。関連する作業には、MKR、KTUP、RCFが含まれます。

 2.2 

接続ベースのアプローチ

接続ベースのメソッドは、主にグラフ内のエンティティ間の接続メソッドを使用して推奨事項を作成します。これらのメソッドのほとんどは、アイテムの属性を含むナレッジグラフをユーザーとアイテムの相互作用マトリックスと組み合わせて、ユーザー属性アイテムのグラフを作成します。マイニングユーザーとアイテム間のさまざまな接続。この方向には2つの基本的な考え方があります。1つはエンティティ間の接続の類似性を使用して推奨を行うことです。メタパスなどのマップの基本的な構造的特徴を定義することにより、異なるパスの下のエンティティ間の相関がユーザーとして計算されます。表現の制約、代表的な作品にはHete-CF、FMGなどが含まれます。2番目のアイデアは、ユーザーとアイテム間のセマンティックパスを掘り起こし、エンティティ間の接続パスの明示的な表現を学習し、それを推奨事項に導入することです。フレームワーク。ユーザーとアイテムの接続関係を直接モデル化するために、代表的な作品にはMCRec、RKGEなどがあります。

 2.3 

スプレッドベースのアプローチ

上記の2種類の方法はどちらも推奨の精度を向上させますが、グラフに含まれるすべての情報を使用するわけではありません。たとえば、埋め込みベースの方法は知識グラフの意味表現の学習に焦点を当てていますが、接続ベースの方法はメソッドは、知識グラフのエンティティに焦点を当てています。接続情報。伝播ベースの方法は、上記の2つのアイデアを組み合わせたものです。基本的なアイデアは、ナレッジグラフ内のエンティティ間の接続パスを使用して、グラフ内のエンティティのセマンティック表現を拡散し、エンティティ間の高次の関係を直接モデル化することです。より合理的にマイニングするために知識グラフに含まれる情報。伝播ベースの方法には、3つの実装アプローチが含まれます。具体的には、最初のアプローチは、ユーザーの履歴動作に基づいており、ユーザーの履歴インタラクティブアイテムのマルチホップネイバーを集約することでユーザー表現を強化し、ユーザーの履歴への関心を統合します。知識グラフ。外側に広がるために、この方向の代表的な作業には、RippleNet、AKUPMなどが含まれます。2番目の方法は、ターゲットアイテムをそのマルチホップネイバーと集約し、アイテムの特性を更新することです。集約プロセスでは、エンティティ表現の集約重みがユーザーとターゲットエンティティによって共同で決定されるため、エンティティ表現の更新プロセスにユーザーの好みが導入されます。代表的な作業には、KGCNなどが含まれます。3番目のアイデアは、ユーザーアイテムの相互作用マトリックスを属性情報を含むナレッジグラフと組み合わせて、ユーザーとアイテムをグラフに統合し、グラフ内のそれぞれのマルチホップネイバー表現と集約して、ユーザーの表現を充実させることです。アイテム、代表的な作品にはKGATなどが含まれます。

 2.4 

章のまとめ

埋め込みベースの方法では、グラフ埋め込みアルゴリズムを使用して、ナレッジグラフ内のエンティティと関係の表現を学習し、それらをレコメンデーションシステムのフレームワークに統合します。その利点は、より柔軟で実践しやすいことですが、この方法はエンティティ間の高レベルの関係を無視し、多くの場合解釈できません。接続ベースの方法は、ナレッジグラフ内のユーザーとアイテム間の複数の接続関係のマイニングに焦点を当てています。その利点は、接続モードが解釈可能性をもたらすことが多いということですが、ユーザーとアイテムの相互作用データがまばらであるシナリオには適していないことがよくあります。 、およびユーザーアイテムとの複雑な関係をいくつかの接続されたユニットに分解すると、情報の一部が失われます。伝播ベースの方法は、グラフ上の伝播メカニズムに基づいており、埋め込みベースの方法と接続ベースの方法の特性を組み合わせて、知識グラフの情報を完全にマイニングします。ただし、重大な欠点は、トレーニングプロセスに必要なコンピューティングリソースが多く、大規模なデータビジネスシナリオではスケーラビリティを考慮する必要があることです。

また、知識グラフを使用して推奨結果に解釈可能性をもたらす主な技術的手段を簡単に要約しました。これには、1)知識グラフの関係を埋め込むための注意メカニズムの使用、2)メタパスなどの基本的な構造単位の定義、3)表現接続パス注意メカニズムを使用する4)ユーザーとアイテム間の相互作用情報を組み合わせた知識グラフで強化学習を使用する5)伝播ベースの方法でエンティティ集約の重みを抽出する。

3.データセット

ナレッジグラフに基づくレコメンデーションシステムは、レコメンデーション効果を向上させ、解釈可能性をもたらすだけでなく、さまざまなレコメンデーションフレームワークと簡単に組み合わせて、多くの実用的なシナリオに適用できます。調査した作品を、映画のレコメンデーション、本のレコメンデーション、音楽のレコメンデーション、ニュースのレコメンデーション、製品のレコメンデーション、POIのレコメンデーション、社会のレコメンデーションなど、アプリケーションシナリオに従って7つのカテゴリに分類し、各シナリオで使用されるデータセットと採用を要約しました。会社の地図を作成し、知識マップの作成方法に従って各作業を要約します。同時に、各アプリケーションシナリオの特徴を説明し、各シナリオの対応するデータセットの基本情報を紹介しました。読者がこのセクションの内容を参照しやすいように、以下の表に要約します。

  表2.データセットの要約  

4.今後の展望

さらに、次のようなこの方向での作業も楽しみにしていました。

1)動的レコメンデーション:知識グラフに基づく現在のレコメンデーションアルゴリズムは、トレーニングに時間がかかり、コストがかかりすぎることがよくあります。静的レコメンデーションシナリオに適しており、ユーザーの関心は長期間安定しています。ただし、実際のビジネスシナリオでは、ユーザーの関心は急速に変化することがよくあります。リアルタイムのフィードバックデータに基づいて推奨戦略を動的に反復し、推奨の適時性を確保する方法は、将来の研究トレンドの1つです。

2)マルチタスク学習:ナレッジグラフ自体のいくつかの問題もレコメンデーションシステムのボトルネックになります。たとえば、ナレッジグラフのファクト情報が不完全であるため、エンティティ間の関係が不足し、無視される可能性があります。ユーザーの好みのいくつか。したがって、ナレッジグラフの完成やレコメンデーションシステムとの共同トレーニングなど、ナレッジグラフに関連するタスクを設計して、レコメンデーション効果を向上させることができます。

3)クロスドメインの推奨事項:実際のビジネスシナリオでは、ユーザーは本や映画など、さまざまなドメインの製品を選択することがよくあります。さまざまな分野のインタラクティブデータを知識グラフと自然に組み合わせることができ、レコメンデーションシステムには複数のシナリオで同様の法則があることがよくあります。したがって、ソースフィールドのインタラクティブ機能を転送学習などの技術を通じて比較的豊富なインタラクティブデータと共有することで、ターゲットフィールドのデータのまばらさの問題を軽減し、複数のフィールドでより良い推奨結果を得ることができます。

4)知識と組み合わせたテキスト表現:ニュース推奨によって表される推奨シナリオでは、テキスト情報を理解することが不可欠です。外部知識グラフの豊富な情報を言語モデルのトレーニングに導入することで、より良いテキスト表現を得ることができます。たとえば、知識と組み合わせたテキスト表現方法ERNIEおよびSTCKAは、ニュース推奨などのテキストベースのアプリケーションで使用できます。正確な推奨事項。

5.まとめ

本稿では、知識グラフに基づいたレコメンデーションシステムの関連作業を調査し、この分野の最新の進捗状況を体系的に要約します。さまざまな調査方法と提案された分類方法の技術的特徴を強調して説明すると同時に、知識グラフを使用して推奨結果に解釈可能性をもたらす方法について説明しました。同時に、さまざまなアプリケーションシナリオで利用可能なデータセットを紹介し、開始の方向性について実行可能な提案を提供しました。最後に、この分野の進歩と発展を促進することを期待して、この研究方向の発展傾向を提唱します。ナレッジグラフに基づくレコメンデーションシステムが上位にあり、ナレッジグラフに含まれる豊富な情報により、レコメンデーションシステムの効果を効果的に向上させ、解釈可能性をもたらすことができます。この記事が、読者がこの分野の研究を理解するのに役立つことを願っています。

紙のダウンロードリンク

[1] https://ieeexplore.ieee.org/document/9216015

[2] http://scis.scichina.com/cn/2020/SSI-2019-0274.pdf

おすすめ

転載: blog.csdn.net/duxinshuxiaobian/article/details/113010831