ます。http://blog.csdn.net/wjmishuai/article/details/71191945からリファレンス
http://www.cnblogs.com/Xnice/p/4522671.html
多くの場合、SVDや改善SVDを使用して、潜在的な(隠された)要因に応じた推奨++
特異値分解(SVD) :
CFは映画を評価するための最も一般的なユーザーシナリオを考え、私たちは、このような予測するスコアリングとして、フィルムの得点シーンにユーザーをシミュレートするために、数学的モデルを必要とします。
Uは、2つの行列の積として見られるスコアリングマトリックス:
ここで、U XYは YのユーザX隠すフィルム特性のための熱意の程度とみなすことができ、そしてI YZは、形質yを見ることができる フィルムで 具現Zの程度を。したがって、これらのモデルの予測式をスコア:
pおよびqは、フィルムと各隠れ品質上のユーザ特性ベクトルに対応します。
上記のモデルは、ユーザーや映画には、例えば、一部のユーザーは、非常にうるさいです常に低い評価を与え、何の違いを反映していません;または映画は奇妙な腐った、不利な批判を探します。上記のケースをシミュレートするために、ベースライン予測因子を導入する必要があります。
μは、すべての料金の基礎であり、biは 平均iはオフセット、府の向かいμフィルムスコアである ように。これらは、パラメータでトレーニングを介して特定の値である必要はなく、対応する平均時間の初期の推定値として使用することができることに留意されたいです。
モデルは、以下を得るために、目的関数を最適化することにより、BI、BU、チー、PUパラメータ:
最小二乗アルゴリズムは、勾配降下法または反復することによって解決することができます。交互更新反復最小二乗アルゴリズム、第1の固定PU最適化チー、チー最適化PU次いで固定されます。勾配降下更新パラメータ方程式の方法以下のように(簡単にするために、目的関数μ+ BI + BU +q⊤ipu一体R ^ UIを置き換えます)。
ここで、αは更新ステップサイズです。
SVD ++:
映画のスコアの利用者は、彼が映画を見たこと次いで、そのような行動は、情報の一定量を意味し、私たちが問題を理解するために来ることができるという事実:サイドから得点行為は、ユーザの嗜好を反映しますこれは、暗黙の引数の形より洗練されたモデルで得られた、モデルに反映され、それは++ SVDあるに反映させることができます。
すべてのムービーのユーザーのために評価されたコレクションは、I(u)は、YJは隠された「映画の評価である jは」個人的な好みの偏りを反映しています。コレクション根付かサイズの収縮率は、実験式と理論的根拠です。
モデルは、以下を得るために、目的関数を最適化することにより、BI、BU、チー、PU、YJパラメータ:
SVD法と同様に、勾配降下アルゴリズムによって解くことができます。
次のように過去の暗黙的なフィードバックとしてユーザ評価データは、アルゴリズムのフローチャートです。