一般的に使用されるレコメンデーションアルゴリズムについて10分で学ぶ

一般的に使用される推奨アルゴリズムの分類

以下は、レコメンデーションシステムをすばやく理解するのに役立つ、一般的に使用されるレコメンデーションアルゴリズムの分類と概念をまとめたものです。

1.人口統計に基づく推奨事項

1.システムユーザーの基本情報に基づいてユーザーの関連性を発見し、類似ユーザーが現在のユーザーに好む他のアイテムを推奨します。
2.ユーザー情報にラベルを付けるプロセスは、ユーザーポートレートとも呼ばれます。ユーザーポートレートは、企業が消費者の社会的属性、生活習慣、消費行動、およびその他の主要な情報のデータを収集および分析した後の、ユーザーのビジネス画像の完全な抽象化です。

2.コンテンツベースの推奨

1.推奨アイテムまたはコンテンツのメタデータに従って、アイテムの関連性を発見し、ユーザーの過去の設定レコードに基づいて、類似したアイテムをユーザーに推奨します。
2.アイテムの内部または外部の特徴値を抽出することにより、類似性の計算を実現します。
3.アイテムの特徴抽出-タグ付け用。エキスパートタグ(PGC)、ユーザー定義タグ(UGC)、次元削減分析データ、非表示セマンティックタグの抽出(LFM)の3つのカテゴリに分類されます
。4。テキスト情報の特徴抽出-キーワード。単語セグメンテーション、意味処理および感情分析(NLP)、潜在意味分析(LSA)
5。機能エンジニアリング。

  • 特徴工学には通常、特徴のクリーニング(サンプリング、異常なサンプルのクリーニング)、特徴の処理、特徴の選択が含まれます。
  • 一部のデータ型の処理。

6.UGCに基づく推奨事項。

  • 簡単な推奨事項
  • TF-IDFに基づく推奨(アイテムiに対するユーザーuの関心の計算)

第三に、協調フィルタリングに基づくプッシュ

1.協調フィルタリングは、コンテンツに基づいていくつかの制限を解決できます

  • アイテムのコンテンツが不完全であるか、入手が困難な場合でも、他のユーザーからのフィードバックを通じて推奨事項を提供できます
  • CFは、ユーザー間のアイテムの評価品質に基づいており、アイテムの品質判断の内容に対するCBの依存の干渉を回避します。
  • CFの推奨はコンテンツによって制限されません。他の同様のユーザーが異なるアイテムに関心を示している限り、CFはユーザーに非常に異なるコンテンツのアイテムを推奨できます(ただし、特定の内部接続があります)

2.ネイバーに基づく協調フィルタリング

  • ユーザーに基づく(User-CF)。基本原則:アイテムに対するすべてのユーザーの好みに従って、現在のユーザーの好みや好みに類似したユーザーグループを見つけ、隣人が好むアイテムを推奨します。
  • アイテムに基づく(Item-CF)。基本原則:アイテムに対するすべてのユーザーの好みを使用し、アイテムとアイテムの類似性を見つけてから、ユーザーの過去の好み情報に基づいて、類似したアイテムをユーザーに推奨します。
  • 使用するシーン。User-CFは主にニュースサイトで使用されており、アイテム数はユーザー数よりもはるかに多く、アイテムの更新度は比較的速いです。Item-CFは、主にeコマース、映画、音楽のWebサイトで使用されており、ユーザー数よりもアイテム数がはるかに少なく、アイテム数や類似性は比較的安定しています。アイテムベースのメカニズムは、ユーザーベースのリアルタイムよりも優れています
  • 利点:アイテムやユーザーの厳密なモデリングは必要ありません。アイテムの機能の説明は、マシンが理解でき、ドメインに依存しない必要はありません。この方法で計算された推奨事項はオープンであり、他のユーザーのエクスペリエンスに使用できます。これは非常に便利です。ユーザーが潜在的な興味や好みを発見するための優れたサポート。
  • 短所:コアは履歴データに基づいており、新しいアイテムと新しいユーザーには「コールドスタート」の問題があります。推奨の効果は、ユーザーの履歴設定データの量と正確さに依存します。ほとんどの実装では、ユーザーの履歴プリファレンスが使用されますスパースマトリックスが保存され、スパースマトリックスでの計算には、少数の人々の間違ったプリファレンスが推奨の精度に大きな影響を与える可能性など、いくつかの明らかな問題があります。

3.モデルベースの協調フィルタリング。

  • 原理:サンプルのユーザー嗜好情報に基づいて推奨モデルをトレーニングし、リアルタイムのユーザー嗜好情報に基づいて新しいアイテムのスコアを予測し、推奨を計算します。
  • 潜在意味モデル(LFM)。モデルをトレーニングするときは、タグの内容に基づいてアイテムの特徴を抽出するか、モデルにアイテムの潜在的な特徴を抽出して探索させ、行列分解による次元削減分析を実行できます。
  • 行列の因数分解。主に交互最小二乗(ALS)と勾配降下アルゴリズムを介して。

4.ネイバーベースのレコメンデーションとモデルベースのレコメンデーションの違い

  • ネイバーに基づく推奨事項は、予測時に既存のユーザー設定データを直接使用し、ネイバーデータを使用して新しいアイテムの設定を予測することです(同様の分類)
  • モデルベースの推奨事項は、これらの選好データを使用してモデルをトレーニングし、内部ルールを見つけてから、モデルを使用して予測を行うことです(回帰と同様)。

おすすめ

転載: blog.csdn.net/wh672843916/article/details/109966318
おすすめ