ハイナ「Qianchuan」:複数のシナリオに対応した統合レコメンドプラットフォーム|セレクション

1 千川由来

Dewu が推奨するシナリオには、ホームページ上のウォーターフォールなどのいくつかの比較的大規模なシナリオに加えて、チャネル、会場、購入中および購入後のシナリオ、ブランド ウォールなどを含む多くの小規模なロングテール シナリオもあります。この種のシーンは、1つのシーンのボリュームが小さく(UVもGMVも小さい)、シーンが分散しており、種類も多様です。このようなシナリオを個別に最適化するには、出力よりもはるかに多くのコストがかかります。ビジネスの発展に伴い、このようなロングテール シナリオはますます増えていく一方であり、そのようなシナリオの最適化を早急に解決する必要があります。したがって、これらの小さなシナリオを実行し、継続的に最適化して利益をもたらすことができる、このような一般的な推奨プラットフォームが必要です。「部分から全体へ」「互換性」「統一プラットフォーム」、これがQianchuanです。

1.png

銭川が解決すべき2つの問題

さまざまなニーズと位置付けを組み合わせると、統合レコメンデーション システムとしての Qianchuan は多くの困難に直面し、少なくとも 5 つの能力が必要です。

2.jpeg

3.png

3 エンジニアリングおよびアルゴリズムのソリューション

上記の困難に対応して、Qian Chuan 氏は統一的な推奨フレームワークを提案しました。Qianchuan ID システムに基づいて、マルチシナリオ推奨の統合最適化が実現されます。

4.png

Qianchuan の推奨フレームワークは通常 5 つの層に分かれています

  • APP サービス層: さまざまなロングテール シナリオとドッキングし、現在アクセスしているシナリオ (トピック、チャネル、会場、購入中および購入後の独立したストリーム、画像出力など)

  • Qianchuan アクセス層: 現在、製品配送サービスを介してアクセスする方法と、Qianchuan 直接接続に登録する方法の 2 つのアクセス方法が提供されています。Qianchuan は、アクセス シナリオの違いに基づいて Qianchuan ID システムを確立し、アクセス シナリオごとに特定の Qianchuan ID (または Qianchuan ID のコレクション) を提供します。

  • Qianchuan DPP レイヤー: 製品推奨 DPP、マルチタイプ推奨 DPP、フロア推奨 DPP、ブランド推奨 DPP など、マルチタイプの推奨ニーズを満たすさまざまな DPP 推奨モジュールを提供します。各 DPP モジュールのフレームワークは基本的に同じであり、推奨の種類に応じて差別化された推奨戦略が設計されます。

  • アルゴリズム レイヤー: 完全なレコメンデーション リンクを構築し、リコール、大まかな並べ替え、詳細な並べ替え、戦略のプロセス全体の効率とエクスペリエンスを最適化します。

    • リコール段階:I2I、U2Iなど5種類のリコールを設計し、シナリオ、行動、関心の逸脱に可能な限り対応し、ユーザーのお気に入り商品をリコールします。

    • 大まかなソート段階: 高パフォーマンスの要件を満たすために、単一ターゲットおよびマルチターゲットの大まかなソート機能を提供して、後続の詳細なソートのための余地を提供します。

    • 改良段階: シーンの違い、ユーザーの関心、複数の目標、プロモーション アプリケーションの観点から、一連のモデルの反復を実行します。

    • 戦略フェーズ: ビジネス ニーズと組み合わせて、ポリシー介入、シナリオ差別化構成、フロー制御と電力調整、ダイバーシティ再配置、マルチタイプ配信などの機能を提供します。

    • インフラストラクチャ層: 機械学習プラットフォーム、インデックス作成プラットフォーム、機能サービス、フロー制御プラットフォームなどの強力な機能を利用して、Qianchuan 推奨フレームワークの完全なセットを作成できます。

4 アルゴリズムの反復プロセス

4.1 リコール大まかな分類の進化

Qianchuan の複数のビジネス シナリオの特性により、リコールと大まかな分類の段階では、シーンの動作の好みの違い、複数のシナリオにおけるユーザーの関心の偏り、シーンのターゲットの配置の違いなど、一連の課題に直面しました。

課題 1: シーンの動作設定の違い

Qianchuan ユーザーの行動は比較的分散しており、さまざまなシナリオでの行動はまばらで、大きく異なります。この種の逸脱に対処するために、Qianchuan はすべてのシナリオでユーザーの長期および短期の行動を収集し、I2I、リダイレクト、トリガーの選択、ベクトル化などの一連の戦略を設計します。

5.png

  • I2I、リダイレクトキャプチャの動作設定
  • 長期および短期の動作を考慮したさまざまなトリガー選択戦略
  • GraphEmb、RankI2Iで動作嗜好のベクトル化を実現

課題 2: 複数のシナリオにおけるユーザーの関心の偏り

さまざまなシナリオにおけるユーザーの興味は完全に一致しているわけではありませんが、具体的なパフォーマンスは次のとおりです: 男性ユーザー A は、テーマのランディング ページで靴、スポーツ、3C などの商品に注目し、化粧品関連に注目します。ギフト チャネルの製品; 女性ユーザー B は、テーマのランディング ページにより注意を払う ページはバッグ、人形などに傾き、ギフト チャネルではバスケットボール、カジュアル衣料、その他の製品により注意を払います。さまざまなシナリオにおけるユーザーの関心には、共通点と相違点の両方があります。Qianchuan は、シーン全体の DSSM ベクトル表現と、シーンの特徴と組み合わせた MIND ベクトルを使用して、複数のシナリオにおけるユーザーの関心の偏りを表します。

  • DSSM は、商品に対するユーザーの基本的な関心を表すフルシナリオ データを導入します。
  • MIND はシーンの特徴を組み合わせて、複数のシーンおよび複数の関心におけるユーザー表現を拡張します

課題 3: シーンのターゲット位置の違い

シーンの配置が異なるため、対応する目標も一貫性がありません。全体は dpv 指向のシーンと uv 値指向のシーンに要約できます。dpv 指向のシーンはクリックの推定に対応し、uv 値指向のシーンはクリックとコンバージョンを同時に推定する必要があります。2 種類のシーン ターゲットについて、Qian Chuan 氏は、ターゲットごとに差別化された予測を実現し、シーン ターゲットの位置の違いを排除するために、ツイン タワーの大まかな列と ESMM モデルの大まかな列を設計しました。

6.png

  • クリック予測を実現する粗選ツインタワーモデル
  • 粗い並べ替えESMMにより、クリックとコンバージョンの多目的推定を実現

4.2 モデルの反復のソート

課題 1: ユーザーの興味をモデル化する

ユーザーの関心のモデリングは常にレコメンダー システムにおける最も重要な最適化ポイントの 1 つであり、ユーザーの過去の行動はユーザーの潜在的な関心を最も直接的に表現しています。

これまでの研究は、ユーザーのリアルタイムおよび短期的な行動のモデル化に主に焦点を当てていました。最近の行動のみを使用するだけでは、ユーザーの長期的な安定した関心や定期的な行動をモデル化することはできません。同時に、レコメンデーション システムのデータ フィードバック ループは、地元で人気の内容です。

7.png

一方で、機能のクロスオーバーが欠如していることです. モデルは deepFM の単一目的パラダイムから dmt パラダイムに基づく多目的モデルに移行します. fm 側の構造は削除されます. ユーザーの行動シーケンス機能は可能ですが、完全にマイニングされており、モデル上のまばらな特徴はクロスオーバーがまだほとんどなく、最適化の余地がある程度あります。

課題 2: シーンの違いをモデリングする

さまざまなシナリオには独自の位置付けがあることが多いため、サービスのユーザーと含まれる製品はまったく異なります。ただし、小規模なシナリオにおけるユーザーの分布と行動の好みも、アクティビティや運用戦略の変化に応じて大きく変動します。

新規ランディング ページ、新規チャネルおよびその他のシナリオでは、新規ユーザーの割合が比較的高く、クリック率は高く、コンバージョン率は明らかに低いです。補助金チャネルは主に費用対効果の高い製品に焦点を当てており、クリックとコンバージョンの意図は次のとおりです。良いですが、aov は全体よりも大幅に高いです 女性チャンネルの視聴者は基本的に女性です。このシーンの商品コレクションは主流のシーンとは大きく異なります。女性ユーザーにも明らかな好みがあります。データによると、その割合はこのシーンでの婦人服やバッグの数は大幅に増加しましたが、会場などのシナリオ、日常的および大規模なプロモーションのユーザー分布と商品プールは大きく変化し、ユーザーの行動もそれに応じて変化しました。大規模なプロモーションの日が集中して変換されるまで、収集意欲は高まり続けます。購入後、支払い後、その他のシナリオでは、ユーザーのニーズが部分的に満たされているため、ブラウジングの深度はそれに応じて低くなります。

反復 1: ユーザーの関心をモデル化する

ユーザーの興味の違いを完全にモデル化するために、シーン内のユーザーと製品のさまざまな明示的な相互統計的特徴の構築に基づいて、ユーザーの行動シーケンスと暗黙的な特徴の交差の完全なモデリングを最適化することでモデルをさらに改善します。ユーザーの好みを特徴付ける際に。

  1. まず、ユーザーの長期および短期のユーザー行動シーケンスを処理するトランスフォーマー構造を追加し、行動シーケンスをマージおよび重複排除して情報容量を増加しました。

  2. モデルの効果を向上させるために、ユーザー統計特徴と疎特徴の明示的な交差を追加しました。

  3. Qianchuan ID、製品、およびユーザー属性の交差特徴をユーザーの行動に追加し、協調構造を使用して暗黙的な交差を行います。

    a. ユーザーの行動シーケンスをフィード特徴として使用し、アテンションの前に埋め込まれたシーケンスを再利用します

    b. cspu、qcid、性別、ブランドなどを誘導特徴として使用して 3 層の mlp を構築します

    c. 3 つの階乗を実行して高次の特徴のクロスオーバーを増加させます

8.png

9.png

反復 2: マルチシーン差分モデリング

さまざまなシナリオの違いを完全にモデル化するために、シナリオ内の商品、ブランド、カテゴリの相互統計的特徴の構築に基づいて、モデル構造をさらに最適化し、さまざまなシナリオにおけるユーザーの好みの違いを完全に学習します。

  1. 機能を構築することでシーンの好みとシーンの効率の違いを説明する

10.png

  1. 機能を構築することで、ユーザー アクティビティ、ユーザー ライフ サイクル タグ、その他の特性を特徴づけます

    a. ユーザーラベル - ライフサイクル

    b. ユーザー別のシナリオ - アクティビティ [exp|clk|buy|clickbuy && cspu|brand|cate]

    c. ユーザーフルシーンアクティビティ [exp|clk|buy|clickbuy && cspu|brand|cate]

  2. mmoe 構造を通じて、モデルはシーンの違いをさらに学習できます。

    a. 機能は充実していますが、異なるシーンのサンプルが混在する場合、1 つのモデルだけでは異なるシーンが干渉したり被ったりして最適な効果が得られにくいため、モデル構成はmmoeの構造をさらに調整して再利用しています。

    b. シーンの違いを強調するには、元の MMoE ゲート ネットワークの入力を調整する必要があるため、Qianchuan ID の情報のみが特徴として選択され、シーン ID の情報はエキスパートを選択するために使用され、ソフトマックスの異なるゲート重みを介してさまざまなシーンが出力されます。

    c. 異なるシナリオについて、モデルはシナリオの違いを認識でき、異なるシナリオは専門家サブネットワークの異なる組み合わせを選択して、異なるシナリオの差分モデリングを実現できます。

  3. ポソ構造を通じて、モデルはユーザー グループの違いをさらに学習できます。

    a. ユーザー機能の最初の使用では、データが不足しているため (新規ユーザーのサンプルは全サンプルの 4.6% のみを占めた)、新規ユーザーの機能がネットワークによって完全に学習および利用されていないことが判明しました。これらの機能をマスクしたパラメトリック分散であってもネットワークへの影響はほとんどありません。

    b. 不均衡な分布特徴の処理を解決するために、POSO 構造が採用され、新規顧客かどうか、販売者かどうか、性別などのユーザー ラベル特徴は主にゲート側で入力されます。特徴。そして、全結合構造でPOSOを使用すると、全結合の各層の出力とゲートの出力がビット単位で乗算されます。

13.png11.png

12.png

推定されたクリックスルー率によると、新規顧客の推定におけるモデルの精度が大幅に向上し、pcoc 全体の観点から、モデルのモデリング効果も大幅に向上していることがわかります。

14.png15.png

5 今後の展望

5.1 ビジネス

Qianchuan はいつものように、さまざまなビジネスの発展をサポートしています。

  • ドッキングプロセスを標準化し、新しいシナリオを拡張し続け、会場のメインマップ、キングコングの位置マップなどの精度と効率を実現します。

  • ビジネス要求を集約し、要求の共通性を磨き、マルチタイプ配信機能、ダイバーシティ再配置機能などの機能をさらに拡張します。

  • システムの安定性を維持し、監視とイージス検査を改善し、関連する問題をタイムリーに発見して対処します。

5.2 アルゴリズム

Qianchuan のリコールの反復では、シナリオ、行動、関心の逸脱への対処に引き続き重点を置きます。一方で、シナリオ関連の機能から開始し、次のようなシナリオの機能を中心にリコール モデルを反復します。 シナリオの機能を独立したものとして導入するタワーを構築し、シナリオ、ユーザー、製品を追加する一方、ユーザーと製品の特性を引き続き深く掘り下げ、価格要素の割合を強化し、価格機能を充実させ、価格とシナリオ、ユーザー、および製品の関係を深めます。製品に合わせて正確なモデリングを実現します。

Qianchuan Jingpai の反復では、引き続きマルチシナリオ差分モデリングの方向に焦点を当て、一方では PepNet などの既存のモデリング パラダイムの先進的な方向を探求します。一方で、シーン内のユーザーの行動シーケンスなどの特徴のマイニングを継続し、それに適合する SAR-Net などのモデル構造を調査します。

さらに、Qianchuan の実際のアプリケーションの多くでは、非ウォーターフォール シナリオが多く、K 個の製品が一度にユーザーに提示されることがあります。例えば、キングコングの位置、中通の位置、会場フロア内、商品分類などのシーンです。このとき、K個の商品がカード上に提示され、K個の推奨位置が相互に影響し合う。再配置の生成など、全画面最適化のアルゴリズムの方向性を探っていきます。

前川会場での製品の推奨は、外部介入や大規模なプロモーションのスケジュールの影響を受けやすく、ランキング モデルは日次ベースラインよりも優れたパフォーマンスを発揮することがよくありますが、大規模なプロモーションになると効率が急激に低下します。これは、アルゴリズム技術革新にとって課題であると同時にチャンスでもあります。継続学習、リアルタイム ODL、LTR などの方向性がさらに検討されます。

5.3 多用途性

さらに、Qianchuan をより多用途にするためのアップグレードを継続し、コンポーネント化、アルゴリズム ライブラリの構築、柔軟な拡張性と複製性の実現に努めていきます。

16.png

QR コードをスキャンして WeChat アシスタントを追加します

ご質問がある場合、またはより詳しい技術情報を知りたい場合は、アシスタント WeChat を追加してください。

WeChat QR コード.jpeg

文:Tmac、Ah Shou、Yaobik

この記事は Dewu technology のオリジナルに属し、出典: Dewu technology 公式ウェブサイト

Dewu Technology の許可なく転載することは固く禁じられています。そうでない場合は、法律に従って法的責任を調査されます。

おすすめ

転載: blog.csdn.net/SmartCodeTech/article/details/131203851