著者: 禅とコンピュータープログラミングの芸術
1 はじめに
ライトFM
LightFMは、Yelp が開発したオープンソースのレコメンデーション システム フレームワークで、大規模な行列分解を簡単に実装できます。このプロジェクトは TensorFlow と Keras フレームワークに基づいており、大規模な行列を迅速かつ効率的に処理できます。次のような特徴があります。
- アイテムとユーザーおよびアイテムの特徴ベクトルの間の相互作用行列を定義して、因数分解を学習し、それをレコメンダー システム タスクに適用することで、行列因数分解モデルをトレーニングする簡単な方法を提供します。
- スパース行列を使用して相互作用データを表現すると、大規模なデータセットを効率的に処理できるようになり、メモリ要件と計算時間が削減されます。
- 損失関数はオプティマイザによって最適化され、モデル効果はさまざまなクロスエントロピー損失関数または比例不均衡重量損失関数によって調整できます。
さらに、LightFM には、学習率、正則化パラメータ、隠れコンポーネントのサイズなど、推奨モデルのパラメータを制御するための多くのオプションが用意されています。これらのオプションを使用すると、モデルのパフォーマンスを制御し、推奨の精度と堅牢性を向上させることができます。
データセットの紹介
この論文では、研究のために Movielens-1M データセットを採用します。データセットには、3,706 本の映画に対する 1,000,209 件のユーザー評価レコードが含まれています。データセットの形式は でuser_id
item_id
rating
、それぞれユーザー ID、映画 ID、映画に対するユーザーの評価を表します。
データ部門
データ セットをトレーニング セット (10%)、検証セット (10%)、およびテスト セット (80%) に分割します。トレーニング セットはモデルのトレーニングに使用され、検証セットはチューニング パラメーターの選択に使用され、テスト セットは最終モデルの評価に使用されます。