推薦アルゴリズムに習熟する2:推薦システムの分類(面接時に必須)

著者について:

テンセント社のアルゴリズム研究者。中国科学院大学修士号取得。彼はアリババとテンセントで長年勤務しており、検索および推奨アルゴリズムに関して豊富な経験を持っています。CSDN ブログのエキスパート、オリジナル記事 100 件。15 件の特許を公開し、そのうち 6 件が承認されました。

一連の記事、フォロー歓迎

レコメンドアルゴリズムに精通する1:レコメンドシステムが必要な理由(連載記事、おすすめ集)

推薦アルゴリズムに習熟する2:推薦システムの分類(面接時に必須)

推奨アルゴリズムアーキテクチャ6:データサンプル(インタビューに必要)

推奨されるアルゴリズム アーキテクチャ 7: 特徴量エンジニアリング (面接官を平手打ちする、史上最も包括的な!)

1。概要

現在、すべての主要なプラットフォームは基本的に独自のレコメンデーション システムを備えており、電子商取引、ソーシャル ネットワーキング、情報、映画音楽などのさまざまな業界に浸透していますこれには、プレーン テキスト、グラフィックス、長尺および短尺のビデオライブ ブロードキャストなどのさまざまなコンテンツ メディアが含まれ、単一列の情報フロー、二重列の情報フロー没入型などのさまざまなインタラクティブ形式を生成します。さらに、ホームページ、垂直カテゴリ関連する推奨事項などのシナリオでも使用できます。

2事業 分野分類

ビジネス分野に応じて、レコメンデーション システムには電子商取引、コンテンツ、ソーシャル ネットワーキングが含まれますその中で、電子商取引には、総合電子商取引、垂直型電子商取引、ワイントラベル、食品配達などのさまざまな分野が含まれており、通常は支払いに関連しています。コンテンツには、ニュース、情報、映画、ショートビデオ、質問と回答、音楽などが含まれており、人々の日々の情報ニーズに応えます。ソーシャル ネットワーキングには、知人とのソーシャル ネットワーキング、見知らぬ人とのソーシャル ネットワーキング、職場でのソーシャル ネットワーキング、さまざまな関心のあるコミュニティが含まれ、さまざまな人々を結び付けるリンクです。

異なるビジネス分野のユーザーは異なる考え方や使用習慣を持っており、それがレコメンデーション システムにいくつかの違いをもたらします。電子商取引は消費チェーンの末端にあり、ユーザーは通常、特定の実際のニーズを持っています。同時に、通常は支払いが必要なため、ユーザーの意思決定コストとコンバージョンコストが高くなります。したがって、検索システムも電子商取引ビジネスでは非常に重要であり、通常はレコメンデーション システムと連携して機能します。さらに、ユーザーの再購入行動は電子商取引シナリオでは非常に一般的であり、多くのユーザーは過去の注文から直接商品を購入することさえあります。最後に、電子商取引ビジネスの制作側の販売者としては、通常、敷居が高く、営業許可およびその他の書類が必要です。

コンテンツは消費チェーンの上流にあり、ユーザーには目的がないことが多く、意思決定のコストが低いことが多いため、レコメンデーション システムに依存することが多くなります。ほとんどの場合、ユーザーは閲覧したコンテンツにはもう興味がないため、推奨システムで露出フィルタリングを行う必要があります。また、コンテンツクリエイターの敷居はEC業者に比べて非常に低く、規模も大きいため、コンテンツクリエイターが混在しやすいのも特徴です。最後に、ニュースなどのコンテンツ シナリオでは、リアルタイム要件が比較的高く、これもレコメンデーション システムにとって大きな課題となります。

コンテンツメディアの分類

コンテンツ媒体に応じて、推奨システムにはプレーンテキスト、グラフィックス、短いビデオ、長いビデオ、ライブブロードキャストなど、さまざまな形式が含まれますメディアが異なれば制作の難易度も異なります。その中でプレーン テキストが最も簡単ですが、長いビデオやライブ ブロードキャストはより困難になります。制作の難易度は、さらにコンテンツの規模や制作者数の違いにつながります例えば、映画やテレビを中核とする長編動画プラットフォームは、短編動画など他のプラットフォームに比べてコンテンツ供給量が大幅に少ない。これは、コンテンツ プールのサイズである推奨システムに反映されます

さらに、メディアが異なれば、ユーザーは異なる情報密度視聴覚体験を得ることができます写真は強い視覚的インパクトをもたらし、ビデオは人々を身体的および精神的によりリラックスさせ、ライブブロードキャストはより優れたインタラクティブ機能をもたらします。これは、レコメンデーション システムのアイテムのクリックスルー率とコンバージョン率に一定の影響を与えます。

インタラクティブフォームの分類

インタラクション形式に応じて、推奨システムにはシングルカラム、ダブルカラム、マルチカラム、イマーシブなどのさまざまな方法が含まれます。インタラクション形態の違いにより、アイテムの情報量や露出密度に違いが生じます通常、複数列フォームでは 1 つのアイテムの表示情報が最も少なく、露出するアイテムの数が最も多くなります。一方、没入型フォームはその逆です。これは、レコメンデーション システムの詳細なランキングなどのモジュールのデータ サンプルに一定の影響を与えます。

さらに、インタラクション形式が異なると、ユーザーの注意とユーザー エクスペリエンスも異なります。たとえば、2 列および複数列のフォームでは、ユーザーがクリックしないと、ユーザーの注意が他の項目に集まる可能性があります。逆に、没入型のシナリオでは、ユーザーの否定的なフィードバックの信頼レベルが高くなります。

最後に、没入型には特別な点があり、露出と変換が統合されており、クリックせずに再生できます。1 列、2 列、および複数列モードでは、通常、情報フロー ページで目的の項目をクリックし、詳細ページにジャンプして表示し、最後に情報フロー ページに戻って参照する必要があります。その他の項目。露出、クリック、コンバージョンなどのステップを踏む必要があります。これにより、レコメンダー システムのモデル化方法に特定の違いが生じます。図 1 に示すように、JD.com APP の推奨システムのさまざまな対話形式が示されています。

図 1 JD.com APP の単一列、二重列、複数列、および没入型インタラクション形式

アプリケーションシナリオの分類

アプリケーション シナリオに応じて、レコメンデーション システムには、ホームページ、垂直カテゴリ ページ、関連するレコメンデーションなどのさまざまなシナリオを含めることができます。ホームページはトラフィックが最も多く、通常は包括的な推奨シナリオであり、さまざまなアイテムがそのトラフィックをめぐって競合します。通常、縦型カテゴリでは、デジタル、紳士服、食品など、対応するカテゴリのアイテムのみが推奨されます。関連する推奨事項には、通常、現在の項目と一定の関連性を持つ他の項目の推奨が必要です。

3 つの間にはモデリング方法に特定の違いがあります。通常、ホームページは最も複雑であり、さまざまなビジネス目標とルール戦略を考慮する必要があります。通常、その推奨プールは最大であり、最も豊富なデータ サンプルが含まれています。垂直カテゴリ ページは個別にモデル化できますが、メンテナンスを容易にするために、マルチドメイン学習に基づいてホームページと組み合わせてモデル化することもできます。関連する推奨事項は、現在の項目に焦点を当て、それに関連する他の項目を推奨する必要があります。通常、相関関係は強いものから弱いものまであります。図 2 に示すように、JD.com APP には推奨システムのさまざまなアプリケーション シナリオがあります。

図 2 JD.com APP のホームページの推奨事項、垂直カテゴリおよび関連する推奨事項

6 まとめ

検索、推奨、広告はほとんどのインターネット企業の中核事業であり、その地位は自明です。この方向で働くエンジニアは非常に幸運です。同時に、検索、レコメンデーション、広告という3つの大きな方向性は同一線上にあり、再利用性が非常に高く、基本的に1つの方向性をマスターすれば、他の2つの方向性も便利になります。この記事は、「レコメンデーション アルゴリズムをマスターする」に関するシリーズ記事の最初の記事であり、今後さらに多くのコンテンツがシリーズ化される予定です。想起、大まかな分類、詳細な分類と再配置、現在の重要な点と困難な点、最適化の方法、業界の古典的なモデルなどの知識体系が含まれます有益な情報がたくさんあるので、注意し収集することを強くお勧めします。

一連の記事、フォロー歓迎

レコメンドアルゴリズムに精通する1:レコメンドシステムが必要な理由(連載記事、おすすめ集)

推薦アルゴリズムに習熟する2:推薦システムの分類(面接時に必須)

推奨アルゴリズムのアーキテクチャ 1: リコール

推奨アルゴリズムアーキテクチャ 2: 大まかなソート

推奨されるアルゴリズム アーキテクチャ 3: ファイン ランキング

推奨アルゴリズムアーキテクチャ 4: 再配置

推奨アルゴリズム アーキテクチャ 5: フルリンク特殊最適化

推奨アルゴリズムアーキテクチャ6:データサンプル(インタビューに必要)

推奨されるアルゴリズム アーキテクチャ 7: 特徴量エンジニアリング (面接官を平手打ちする、史上最も包括的な!)

おすすめ

転載: blog.csdn.net/u013510838/article/details/135184922