アンドリュー・ウの機械学習(16) - 推薦システム

序文

現在、淘宝網のショッピングの際に商品を閲覧したときにユーザの好みを記録した後、商品の同じタイプをお勧めしますか、あなたに興味を持っていることを感じることが推薦システムなどのシステムに関与することになります推奨されるインターネット製品、と私たちの生活の中で、ニュースを閲覧するに従ってあなたのためのニュースのコンテンツ推薦コンテンツの種類と閲覧履歴が、これは推奨システムは、常識を持っています。

コンテンツベースの推薦システム

1は、問題の説明を
、我々はフィルムのサプライヤーであれば、私たちは、フィルムスコアリングにユーザーが必要な5本の映画や4人のユーザーを持っています。最初の3つの映画は愛の物語です、後者の二つはアクション映画があり、私たちは、アリスとボブはキャロルとDaveは、より多くのアクション映画に傾いているようですしながら、より多くの、ロマンスに傾いているようだということがわかります。そして、ユーザーは、あまりにも、すべてのムービーを再生する必要はありません。私たちは、それらの一つ一つは、彼らが戦う、と推奨根拠などはなかった映画を見ている可能性がどのように多くのポイントを予測するアルゴリズムを構築したいです。
以下のマーカーのうちのいくつかを導入:
NUの数は、ユーザ表し
NMする膜の数を表し
、IはR(I、J)= 1によって評価フィルムにユーザjもしR(i、j)を
するユーザjのY ^(i、j)は^代わっiの映画のスコア
あまり映画のユーザーに代わって総数MJ jの評価
ここに画像を挿入説明

2、推薦システムのアルゴリズム
我々は2つの変数x1を導入し、ここで示されているようにロマンチックな映画(ロマンス)の度合いを表し、x2はモーションムービー(アクション映画)の程度を表します
ここに画像を挿入説明

今、私たちは推薦システムのアルゴリズムに、これらの機能の上に構築したいです。我々は、このようなθ(1)として、各ユーザーのための線形回帰モデルを訓練してきた、線形回帰モデルを採用したとすると、最初のユーザパラメータモデルです。だから、最初に我々はもちろん、下記の式(プラス正則化パラメータ)を持って、この式は、最初のユーザーのためのモデルであり、そして我々は、モデルのすべてのユーザーを期待するならば、我々は、次の二式を有します。したがって、我々は我々のモデルではθ(n)は偏微分を解決された第2の式に従って勾配降下法を使用して更新することができます。
ここに画像を挿入説明

第二に、協調フィルタリング

上記のモデルは、私たちが逆に来れば、我々は(i)は、各ユーザーの権限値θというこれら2つのパラメータの値を知っているが、知らない、映画の種類は、特性値x1とx2のを与えることを知っているということでしょうか?
ここに画像を挿入説明
我々はまた、我々は協調フィルタリングとして知られている方法、ユーザーのθ(I)に従ってモデルを解決するために、当社のコスト関数を使用することができ
、次の手順を使用してフィルタリングするアルゴリズムをコラボレーティブ:

初期X(1)、X(2 )、... X(m)は、θ(1)、θ(2)、...Θ(M)) のランダムな小さな値の数の
勾配降下アルゴリズムを使用してコスト関数を最小化します
学習アルゴリズムが完了した後、我々は(θ(J))のTx(予測 I) フィルムからiスコアのために、Jのユーザーを
ここに画像を挿入説明

第三に、低ランク行列の因数分解と平均正規化

1、低ランク行列の因数分解
、その後Y行列は5行4列の行列であり、ユーザデータは、映画を獲得します、我々は5つのムービー、および4人のユーザーを持っているが、マトリックス中に存在している右の行列のスコアを導入することができます。
ここに画像を挿入説明
ユーザーが映画私を見て、あなたがフィルムと5を探している場合は、ユーザーにお勧め5本の新しい映画を与えるために、あなたがする必要がある、映画と非常によく似ている場合には、映画jを見つけると、これらの異なる映画の中でされますあなたは、ユーザーが複数の異なる映画をお勧め与えることができますので、私たちは、映画の私の最小値から探しています。
ここに画像を挿入説明

2、平均正規化

平均正規化(平均正規化)我々は大きすぎる、私たちは多くの場合、平均正規化にそのうちの1つは固有値を、スケーリングする必要性があるため、異なる特性値との差に、このモデルについてのアルゴリズム学校を学ぶ時間を返す前に、式は、(X - U)/(最大-最小)
、我々はこのように、以下の未知変数を解くことができ、行列Yの平均正規化処理の結果、各ユーザ膜の部分未知の変数のために、私たちの新しいモデルは、彼女は、各映画のスコアを与えたと思うだろう、映画のスコアのすべてのユーザの平均スコアを減算することは、映画の平均スコアです。
ここに画像を挿入説明
参考文献「アンドリュー・ウ機械学習」推薦システム16の
16推薦システム推薦システム
アンドリュー・ウ機械学習ノート(16) -推薦システムの
アンドリュー・ウ機械学習-推薦システム

公開された80元の記事 ウォンの賞賛140 ビュー640 000 +

おすすめ

転載: blog.csdn.net/linjpg/article/details/104401361