LightFM: 大規模な行列分解を簡単に実装し、大規模な行列を迅速かつ効率的に処理できるオープンソースの推奨システム フレームワーク

著者: 禅とコンピュータープログラミングの芸術

1 はじめに

ライトFM

LightFMは、Yelp が開発したオープンソースのレコメンデーション システム フレームワークで、大規模な行列分解を簡単に実装できます。このプロジェクトは TensorFlow と Keras フレームワークに基づいており、大規模な行列を迅速かつ効率的に処理できます。次のような特徴があります。

  • アイテムとユーザーおよびアイテムの特徴ベクトルの間の相互作用行列を定義して、因数分解を学習し、それをレコメンダー システム タスクに適用することで、行列因数分解モデルをトレーニングする簡単な方法を提供します。
  • スパース行列を使用して相互作用データを表現すると、大規模なデータセットを効率的に処理できるようになり、メモリ要件と計算時間が削減されます。
  • 損失関数はオプティマイザによって最適化され、モデル効果はさまざまなクロスエントロピー損失関数または比例不均衡重量損失関数によって調整できます。
    さらに、LightFM には、学習率、正則化パラメータ、隠れコンポーネントのサイズなど、推奨モデルのパラメータを制御するための多くのオプションが用意されています。これらのオプションを使用すると、モデルのパフォーマンスを制御し、推奨の精度と堅牢性を向上させることができます。

データセットの紹介

この論文では、研究のために Movielens-1M データセットを採用します。データセットには、3,706 本の映画に対する 1,000,209 件のユーザー評価レコードが含まれています。データセットの形式は でuser_id item_id rating、それぞれユーザー ID、映画 ID、映画に対するユーザーの評価を表します。

データ部門

データ セットをトレーニング セット (10%)、検証セット (10%)、およびテスト セット (80%) に分割します。トレーニング セットはモデルのトレーニングに使用され、検証セットはチューニング パラメーターの選択に使用され、テスト セットは最終モデルの評価に使用されます。

2. 基本的な考え方

おすすめ

転載: blog.csdn.net/universsky2015/article/details/132053433