16.1フォーマル問題
その理由は、(1)以下の主点推薦システムを話します。
1.推薦システムは、学術界の割合が低いものの、機械学習の非常に重要なアプリケーションであるが、それは商用アプリケーションに非常に重要であり、高い優先順位を占めています。
2.大きなアイデアを伝えるために機械学習は:特性から学ぶことができ、かつ選択するマニュアルを必要としません。
(2)ケース説明:動画推薦装置
誰もが、彼らが戦うことはなかった映画を見て、推奨根拠としている可能性がどのように多くのポイントを予測するアルゴリズムを作成したいです。
(3)タグの一部で導入されます。
N- Uは、ユーザーの数を表します。
N- mは映画の数を表し、
R(i、j)は膜iはrで評価された場合にユーザにJ(I、J)= 1、
Y- (i、j)は映画のスコアを再生するためにj個のユーザーを表し、
M Jは、フィルムのユーザ評価の合計数を表します。
16.2コンテンツベースの推薦システム
(1)概要:それは実際にはすでにXの特性を持って、その後、後述するユーザーに基づいてパラメータθフィットを、見つけている映画の内容に基づいて、それは映画がXを特徴とフィットするように求めて、すでにパラメータθであります
(2)各膜の既知の特性を仮定すると(コンテンツに基づきます)。
パラメータ:、θ (j)はユーザjを示すパラメータ、X (i)は、フィルムIの特性を示し
(θ:ユーザーや映画jのiについては、我々はスコアが予測(J) )のTx (I)
シングルユーザーのコスト関数のため(のため、サンプル数mに省略θが0、スコアのみ計算される正規化されていない)次のように
したがって、すべてのユーザーのためのコスト関数へ:
勾配降下更新方法グラデーション式:
16.3協調フィルタリング
(1)ユーザーに基づいて(すなわち、既知のユーザパラメータθ、フィルムの特性は、xを求める)、コスト関数となります。
(2)いずれも特性X既知の協調フィルタリングアルゴリズムは、両方のパラメータθを最適化するためにユーザを知らないが、ではありません。
費用関数は次のとおりです。
コスト関数の偏微分の:
(3)協調フィルタリングアルゴリズムのステップ:
1.初期化X (1)、X (2)、...、X (N- M)、θは(1)、θは(1)、...、θは(N- U)小さなランダム値の数のために、
前記コスト関数を最小化するために勾配降下アルゴリズムを使用して、
3.学習アルゴリズムの後、我々は(θ予想(J) )T X- (i)を、私はJの映画を評価するユーザーのために。
(4)お勧めのユーザーを与える方法:
1.算出されたスコアは、ユーザーに作品評価が高いです。
2.ムービー、ユーザに推薦映画のようなコンピューティング機能との間の類似性に基づいて、映画を見た場合。
16.4協調フィルタリングアルゴリズム
16.5ベクトル化:低ランク行列分解
データセットは、マトリックススコアに格納される- >協調学習素子(θを通して濾過し、得られた(J) )T X (I)予測マトリックスにおける- >映画特性距離にムービー間の類似度を求めます
仕事の実装の16.6詳細
概要:どのように新しいユーザーに映画(ユーザーのスコアとして、各映画の意志平均スコア)をお勧めします
(1)ユーザー評価データだけでなく、新規ユーザーイブ:
(2)各映画のために行うの正規化を意味し、データモデルとして訓練
(3)に加えて、映画フィルムの最終的なスコアであることを意味し、予測の値:
(4)平均は、モデルがフィルムの新しいユーザ評価など各映画意志を学びました。