レコメンデーションシステムのユーザーの肖像
ユーザーポートレート作成方法
- 1. 最初のカテゴリの基本情報は、登録時のユーザーの元のデータを直接使用することです。たとえば、人口統計情報や、最初に登録したとき、初めてコンテンツを表示したときなど、一度発生すると変更されない一部の動作情報です。コンテンツのこの部分は静的情報(Static)とも呼ばれます。この基本的な情報は、アカウントのチェックに似ていますが、実際には技術的な内容はありませんが、ユーザーのコールドスタートシナリオには非常に役立ちます。
- 2. 2番目のカテゴリ動作情報は、ユーザーの履歴動作データの継続的な蓄積です。統計は、最も一般的なユーザーのポートレートデータの1つでもあり、ヒープデータとして理解できます。ここで詳細を確認する場合は、動作情報を次の2つのカテゴリに分類することもできます。
- 基本的な動作、ログイン数、支払い回数などの単一の統計を通じて取得された動作情報。
- 派生的な行動には、基本的な行動統計の二次計算に基づく行動情報が必要です。
- 3. 3番目のカテゴリモデルラベルは、実際にはブラックボックスです。機械学習方法またはディープラーニングを通じて、人間が管理コミュニティを制御できない高密度のベクトル埋め込みを学習できます。これは、非技術者には評価されません。中国が担う役割は非常に大きい。** 2つのカテゴリも含まれます。
- ラベル付けされたデータの場合、機械学習はユーザーまたはアイテムを階層化またはグループ化するために使用されます。このレベルはユーザーが直接理解して使用できます。
- 浅いセマンティックモデルを使用してユーザーの読書関心を構築したり、行列分解を使用して隠れた要素を取得したり、ディープラーニングモデルを使用してユーザーの埋め込みベクトルを学習したりするなど、直感的に理解できません。このタイプのユーザープロファイルデータは通常不可解であり、他のユーザーが直接理解することはできません。
ユーザーの肖像画はレコメンデーションシステムの目的ではなく、レコメンデーションシステムの構築プロセス中に発生するキーリンクの副産物です。
ユーザーポートレートの重要な要素
- 次元
- 1.各次元の名前が理解できる
- 2.次元数
- 3.どの寸法
- 定量化実際の生産システムでは、ユーザーの肖像画の各次元の定量化をマシンに渡し、目標指向である必要があります。推奨効果に基づいて逆にユーザーの肖像画を最適化することは理にかなっています。
- 効果はなく、ユーザーとユーザーの肖像画の肖像画に、それはとても(良いか悪いかの並べ替え、リコール報道やその他の指標)の使用に基づいて肖像画の影響を定量化するために、ユーザーを導くために、ちょうど副産物推薦システムです。
---------------------ゴージャスな分割線----------------
ユーザーのポートレートの本質は次のとおりです。ユーザーの基本的な属性とユーザーの行動に基づいてアイテムの情報をユーザーに転送
し、ユーザーのポートレートに書かれた2つの側面(コア、乾物)を形成します。
- 1ユーザーの基本的な属性には、性別、年齢、趣味などがあります。
- 2ユーザーはクリック、読み取り、共有などによってアイテムを操作し、これらのアイテムに付属するタグ(tfidfキーワード、textrankキーワード、ldaキーワードなどの最初のステップでマイニングされたテキスト情報)に加重平均を設定できます。ユーザーに転送され、上記の方法で取得されたアイテムに多くのラベルがあると思われる場合は、ユーザーのグループ化に使用されるラベルを少なくすることで(ユーザーのグループ化の組み合わせの数を少なくできるように)、合格できます(chi検査または情報の取得)、ユーザーのポートレートを形成するためにいくつかのより重要なタグを選択する。
ユーザーのポートレートに応じて、対応する記事情報をプッシュします
簡単なテキスト検索はelasticsearchを使用して行うことができ、これらをマトリックスに変換すると、faissを使用してマトリックスを取得できます。