どのようにするときのないデータ推薦システムを構築するには?3つのオプション付き!

ユーザデータが存在しない場合でも、我々は、ユーザーが参加することができ、ユーザにとってより質の高いコンテンツを示し、効果的な推薦システムを構築することができました。どのようにするときのないデータ推薦システムを構築するには? 3つのオプション付き!

あまりにも長いバージョンを見てはいけません。

最初のステップは、推薦システムは、ユーザが他の類似の商品をお勧め与えるコンテンツベースの推薦システムを構築することですが、他のユーザーのデータに依存しません。これらの特性は、それ自体からではなく、ユーザーの行動内容のエントリ(すなわち、数学式は、式推薦アルゴリズムは、動作のさまざまな側面であるコンテンツ・アイテムの使用を必要とします)。書かれたテキストで、我々はセマンティック技術を使用することができ、テキストの特徴を抽出します。

リファレンスとして推奨されるシステムのモデルでは、我々は、メタデータは、テキストから抽出されたシステムは、可能な限り最適化されているような、他の機能を導入することができます。そこには明示的なユーザーIDがありませんが、まだ勧告をパーソナライズされたユーザーアカウントのプロキシを使用することができますが。ローカルベースの推薦システムセッションの設定、セッション中にリアルタイムトレンドことができ、ユーザーがシステムにアクセスするたびに複数の項目を見ていると仮定します。

テキストバージョン:

「いかなる状況においても、推薦システムを構築する方法のユーザデータは?」我々は、この問題が繰り返し発生している、と今日、私はそれに答えることを試みました。

本論文では、いくつかの専門用語を使用するシステムは、(重要な部分)をお勧めしますどのように動作するかの基本的な知識のシリーズが表示されます。それは技術的な問題に来るとき、私たちはあなたと特定の技術環境を説明します。

一般的には、ユーザデータ例存在しない場合に、推薦システムを構築するための3つの方法があります。私は他に、以下に記載されているの複雑さに応じてそれらを置く、我々は今、手持ちのすべての利用可能なデータを利用できることを前提としています。これら3つの方法は、後者の各々は、ユーザとして固有の識別情報とユーザデータを使用した方がよいが、実際に、全てのデータ手元。

コンテンツベースの推薦システム構築し
、すべてのコンテンツ推薦システム第一に基づいを、我々は特定のタグまたは標準ビルドの特性など、他のコンテンツのメタデータすることができます。我々は、タグは、テキストの一部のみ辞書データ構造を指し、各ワード(プレ計算すべてが辞書内の単語の良い集合で表しており、このモデルでは、TF-IDFアルゴリズムを評価するためのモデルを使用することができます。 )

具体来说,假设我们充分利用所有的标签以及其他特征来构建该词典,那么该词典会帮助我们构建所谓的“特征向量”。之后,我们以特征向量为基础,对比不同的内容条目,搭建推荐系统。到了这一步,一个基于内容的推荐系统已初步完成,从我的研究经验来看,该系统的推荐效果相当好。我们现在做的所有工作都是在向用户推荐类似于历史商品的商品。“类似”一词这里指,推荐的商品与历史商品相比,有类似的标签和特征。

如果我们想搭建精度更高的推荐系统,要做的第一件事便是迭代上述初级推荐系统,并在此基础上不断优化。接下来我将介绍其他方法。

优化基于内容的推荐系统
上述步骤利用了包含现有标签和其他特征的单一词典。提高推荐精度的下一步是构建两个及两个以上的词典——对应元数据的不同类别,我们可以基于多个词典,在推荐系统中采用TF-IDF统计方法,计算每一内容条目得分的加权组合。我们可以根据主观评估的结果优化参数(如每一项得分的权重)。这取决于哪一项参数权重能带来最好的推荐效果。

如果某一类元数据不能用TF-IDF进行加权统计,如这组数据不相关,那我推荐大家把这组数据细分成不同的种类。做了这样的细分处理后,我们会获得另一组标签(细分后的每一类数据都有各自对应的标签)。假设这个过程中未大量出现其他特征,那并不会加大整个工作的难度。

接下来可以在系统中引入过滤技术,如加某个特定标签,进一步优化推荐系统。它不是核心算法的一部分,但如果我们想在推荐系统中嵌入某种算法,从而实现用户自定义推荐准则的操作,那么过滤技术便是该算法的附加支撑结构。

搭建采用用户代理的推荐系统
提高系统推荐精度的下一步是观察能作为用户代理的那些数据特征。虽然我们没有用户账号,但可能有IP地址、浏览器信息、用户会话等其他信息。

この時点で、私たちは抽象ユーザーを構築することができます。このユーザーアカウントは検証できませんでしたが、彼らはプロトタイプの指紋技術を持っています。我々は、ユーザーがパーソナライズされた推奨を生成することができますように、ユーザーの「抽象的」と命名したら具体的には、協調フィルタリング技術の様々な使用です。私の意見では、これは複雑ではありません - 私たちは(そのような高次のPythonパッケージなど)のオープンソースプロジェクトの多くを見つけることができます。キーは、私たちが、ユーザーアカウントの既存のプロキシ情報を構築するために助けることができるということです。

また、我々はまた、インタラクティブなデータユーザをクリックする必要があります。私たちは、そうでない場合は、さらなる最適化のために、ユーザの嗜好を追跡する方法はありません、ユーザーがクリックされた項目を知る必要があります。あなたがしたら、ユーザーは、インタラクティブなデータの抽象化をクリックすると、ユーザーアカウントは、パーソナライズされた推薦システムを構築することができるようになります作られたIPアドレスやブラウザの情報を組み合わせたものです。これが本当のパーソナライズされた勧告ではありませんが、本当の個体から遠くではありません。

セッションベースの推薦システム構築する
方法の概要は、推薦システムの最後のセッションを構築することです。これは、前述の方法と似ていますが、今回は特定のセッション内のデータを懸念しています。我々はユーザー情報を取得できない場合でも、ユーザーセッションデータを取得することも可能です。アカウントのユーザーセッションでは、と非常にローカライズされた「ユーザーアカウント」までピアにできるようになります。

セッションの数に基づいて推薦システムは、推薦システムの精度を構築するためにリカレントニューラルネットワーク(RNN)に基づいて、それらのいくつかは、このような研究として、非常に高く、Karatzoglou 2 Hidasiが行わ。これらのシステムの推奨される効果は非常に満足しています。

これは、ユーザーがシステム、セッションベースの推薦システムにいくつかの時間のために滞在する準備ができていることを前提としています。あなたがそのようにした、と十分クリックすると、システムの効果は、より良い勧告、ユーザーにとってより魅力推薦コンテンツとなります。

原文标题:あなたはAudienceDataを持っていない場合は推薦システムを構築する3つの方法は何ですか?

第四のパラダイムによってコンパイルQuoraのから上記コンテンツは、最初のリリースをお勧めします。

おすすめ

転載: blog.51cto.com/13945147/2420729