美団のおすすめレストランにおけるマルチシナリオ・マルチタスク学習の実践

推奨アルゴリズム技術の継続的な開発により、クロスシナリオ学習はますます多くの研究者の注目を集めています。Meituan Dine Algorithm Team は、業界の関連技術に触発されて、店内での食事のマルチシナリオ推奨の最適化を探求し続けており、マルチシナリオ マルチタスク学習推奨の分野で多くのアプリケーション経験を蓄積してきました。チームは、店内ケータリングのグローバル レコメンデーション シーン データを使用して、統合されたマルチシナリオおよびマルチタスク学習モデルをトレーニングしました。これにより、繰り返しの開発が削減され、複数の店内ケータリング レコメンデーション シナリオに実装され、顕著な結果が得られました。

この記事では、Meituan の店内ケータリング ビジネスにおけるマルチシナリオおよびマルチタスク学習のソリューションについて詳しく説明し、このソリューションに基づいた学術論文「HiNet: Novel Multi-Scenario & Multi-Task Learning with Hierarchical Information Extraction」が採録されました。 ICDE 2023 に含まれる国際データ エンジニアリング会議による。

1. 背景

ネットワーク情報とサービスの爆発的な成長に伴い、レコメンダー システムは、高品質でパーソナライズされた意思決定の提案とエクスペリエンスをユーザーに提供するための重要なコンポーネントになりました。従来のレコメンデーション システムでは、モデル サービスは通常、特定のシナリオ用に個別に開発して、さまざまなシナリオでのデータ分布と特徴空間の違いに適応する必要があります。ただし、Meituan やその他の産業用インターネット プラットフォームでは、通常、ユーザー アクセスの意思決定リンクに基づいて動作し、パーソナライズされた情報に基づいて、さまざまな推奨シナリオ (ホームページ情報フロー、垂直サブチャネルなど) があります。シナリオ毎のレコメンドモデル、表示項目をソートし、最終的にユーザーに提示します。

Meituan Diandian(以下、Dinning)プラットフォームでは、ビジネスの洗練の発展傾向に伴い、店舗での食事に対するユーザーのパーソナライズされたニーズを満たすために、推奨システムの構築をカスタマイズする必要があるシナリオがますます増えています。下の図 1 に示すように、実際には、ユーザーは複数の異なるシナリオを参照してクリックし、最終的に取引を行うことがよくあります。

図 1 Meituan Dafan プラットフォームでのユーザー インタラクション プロセス

ただし、推奨されるシナリオの数が増加するにつれて、単一のシナリオに対する従来の独立した推奨モデルの開発は、多くの場合、次の問題につながります。

  1. 単一のシーン自体のデータのみに基づくモデリングでは、複数のシーンで繰り返し商品が表示される可能性があることを考えると(上記の図 1 の赤い四角の部分が実際には同じ製品です)。
  2. 一部のロングテール ビジネス シナリオでは、トラフィックが少なく、ユーザーの行動がまばらであるため、モデルが効果的にモデル化するにはデータ量が十分ではありません。
  3. 各シナリオの機能マイニング、モデル トレーニング、およびオンライン デプロイは独立して開発され、互いに分離されているため、計算コストとメンテナンスの負担が大幅に増加します。

一般に、レコメンデーション アルゴリズムには、各シーンを個別にモデル化する際に多くの制限があります。ただし、複数のシーン データセットを組み合わせてランキング モデルをトレーニングし、サービスを提供するだけでは、各シーンの固有の情報を効果的に取得することはできません。

さらに、マルチシナリオのレコメンデーションの問題に加えて、通常、クリックスルー率 (CTR) やクリックからクリックへの変換など、共同で最適化する必要がある各シナリオでのユーザー満足度やエンゲージメントなどのさまざまなメトリックがあります。レート (CTCVR)。したがって、複数のシナリオでさまざまな指標の複雑さを最適化する問題 (つまり、マルチシナリオ・マルチタスク最適化問題) を解決するために、効果的で統一されたフレームワークを開発する必要があります。

最近のいくつかの研究では、関連する方法がマルチシーンの推奨をマルチタスク学習 (Multi-Task Learning、MTL) 問題としてモデル化することが多く、これらの方法のほとんどはマルチゲート混合エキスパート (Multi-gate Mixture -of-Experts、 MMoE) ネットワーク フレームワークをモデル改善の基礎として使用し、シーン間の共通性と特性を学習します。ただし、この MTL ベースの方法は、最適化のために複数のシーンのデータ情報を同じ特徴空間に投影することが多く、複数のタスクを持つ多くのシーン間の複雑な関係を完全に把握することは困難であり、マルチシーンのパフォーマンスをさらに向上させることはできません。シーン マルチタスク学習モデル。

直感的に、マルチシナリオおよびマルチタスクの情報モデリングは、さまざまなレベルの最適化に属し、階層的に処理する必要があります。したがって、本論文では、階層型情報抽出ネットワーク(HiNet)を提案します具体的には、エンドツーエンドの 2 層情報抽出フレームワークを設計して、シーンとタスク間の情報共有とコラボレーションを共同でモデル化します。

まず、シナリオ抽出レイヤーでは、HiNet はシナリオ共有情報とシナリオ固有の情報を別のエキスパート モジュールを介して抽出できます。現在のシーンの表現学習をさらに強化するために、現在のシーンの情報表現への他のシーンの寄与を明示的に学習するシナリオ認識ネットワーク (SAN) を設計します。

次に、タスク抽出レイヤーでは、タスク共有とタスク固有のエキスパート ネットワークで構成されるカスタム ゲーティング ネットワークを使用して、マルチタスク学習における共有情報とタスク固有の情報との間のパラメーター干渉を効果的に軽減します。

モデル構造でシーン レイヤーとタスク レイヤーの情報抽出を分離することにより、さまざまなシナリオの複数のタスクを最適化のためにさまざまな特徴空間に明確に分割でき、モデルのパフォーマンスの向上に役立ちます。

論文全体の主な革新は次のとおりです。

  1. 階層的な情報抽出アーキテクチャが革新的に適用された、複数のシナリオで複数のタスクメトリックを最適化するための新しいマルチシナリオマルチタスク学習モデルである HiNet を提案します。
  2. シーン情報抽出層では、シーン情報モデリングの能力をさらに強化するシーン認識ネットワーク SAN モジュールを提案します。
  3. オフライン評価とオンライン A/B テストの実験は、HiNet が現在の主要な方法よりも優れていることを示しています。現在、HiNet は Meituan Dianzhong の 2 つのシナリオで完全に展開されています。

2. 階層情報抽出ネットワーク

2.1 問題定義

前述のように、私たちは主にマルチシナリオとマルチタスクの推奨の最適化問題に焦点を当てています。問題を次のように定義します: y ^ ij = fij ( x , si ) \hat{y}_i^j=f_i^j\left(x, s_i\right)y^=( x ,s),其中 s i s_i s示しますiシーン インジケータ、y ^ ij \hat{y}_i^jy^是第 i i iシーンのjjj , xxの推定値x は、入力の密な特徴を表します。

元の特徴入力には、主にユーザーのポートレートの特徴、ユーザーの行動の特徴、現在のシーン固有の特徴、および製品の特徴が含まれます.数値の特徴は最初に分類の特徴に変換され、次にすべての分類の特徴が低次元のベクトル空間にマッピングされて取得されますxx×Meituan Dafan プラットフォームの特定の最適化目標を考慮して、各シーンに CTR と CTCVR の 2 つのタスクを設定しました。

2.2 方法紹介

このセクションでは、階層的な情報抽出ネットワーク モデルである HiNet を紹介します。以下の図 2-(A) に示すように、HiNet モデルには主に、シーン抽出レイヤーとタスク抽出レイヤーの 2 つのコア モジュールが含まれます。シーン抽出レイヤーは、主にシナリオ共有エキスパートモジュール、現在のシナリオ固有のエキスパートモジュール、シーンアウェアアテンションネットワークを含み、これら3つの部分の情報抽出を通じて、最終的にシーンレベルが形成されます.タスク抽出レイヤーでは、カスタム ゲーティング ネットワーク モジュール CGC (Customized Gate Control) を使用して、現在のシーンのマルチタスク学習をモデル化します。上記の HiNet モデルの主要部分について、以下で詳しく説明します。

図2 階層情報抽出ネットワークモデル構造

2.2.1 シナリオ抽出層

シーン抽出層の役割は、シーン固有の情報表現とシーン間で共有される価値のある情報表現を抽出することであり、タスクレベルの情報表現の能力を向上させるための基礎となります。シーン抽出レイヤーには、主に、シーン共有エキスパート ネットワーク、シーン固有のエキスパート ネットワーク、シーン認識アテンション ネットワークの 3 つの部分が含まれます。これらについては、以下で順番に紹介します。

  1. シーン共有・独自の専門家ネットワーク

クロスシナリオの散在するユーザーの行動と、複数のシナリオ間で製品が重複する現象を考慮すると、ケータリング ビジネスでは複数のシナリオのデータの間に貴重な共有情報があります。戦略的に、シーン共有の専門家ネットワークを設計します。混合エキスパート ネットワーク アーキテクチャ MoE (Mixture of Expert) の影響を受けて、シーン共有エキスパート ネットワークは、サブエキスパート統合モジュール SEI (図 2-© に示すように、サブエキスパート統合モジュール) を使用して生成されます。

具体的には、シーン共有エキスパート ネットワークの最終出力はGGです。G、式は次のとおりです。

  1. シーン認識アテンション ネットワーク

前述のように、異なるシーン間にはある程度の相関関係があるため、他のシーンからの情報も現在のシーンの情報表現に寄与することができ、現在のシーンの情報表現能力を高めることができます。異なるシナリオが互いの表現能力に異なる影響を与えることを考慮して、現在のシーン情報の表現に対する他のシーン情報の貢献の重要性を測定するために、シナリオ認識型の Attentive Network (SAN) を設計します。具体的には、SAN は入力の 2 つの部分で構成されます。

2.2.2 タスク抽出層

マルチタスク学習における負の転移の問題を解決するために、タスク抽出レイヤーでは、PLE (Progressive Layered Extraction) モデルに着想を得て、カスタム ゲーティング ネットワーク CGC モジュールを使用します。

カスタム ゲーティング ネットワーク

カスタム ゲーティング ネットワークは主に、タスク共有エキスパート ネットワークとタスク固有のエキスパート ネットワークの 2 つの部分で構成されます。前者は主に現在のシーンのすべてのタスクで共有される情報の学習を担当し、後者は現在のシーンの各タスクの固有情報を抽出するために使用されます。

2.3 トレーニングの目的

提案された HiNet の最終的な損失関数は次のとおりです。

3.実験

3.1 実験装置

  1. データ収集: 私たちは、Meituan Dafan プラットフォームで 6 つのシナリオ (シーン番号 a から f) のユーザー ログ データを、マルチシナリオ マルチタスク トレーニングおよび評価データセットとして収集しました。シナリオ a と b は大きなシナリオ データ セットです。対照的に、c ~ f は小さなシーン データセットとして扱われます。

表 1 各シーンのサンプル データ セットの統計

  1. 評価指標: 各シーンの CTR および CTCVR タスクの性能評価を個別に検討し、マルチシーンおよびマルチタスク データセットの評価指標として AUC (Area Under ROC Curve) を使用します。
  2. モデル比較: 提案した HiNet モデルを業界の SOTA (State-Of-The-Art) モデルと公正に比較するために、同じ実験環境とモデル パラメーターを使用し、各モデルを完全に調整および最適化します。多くの実験を行います。具体的な比較モデルは次のとおりです。

マルチタスク学習モデル:

  • Shared Bottom: モデルは、ハード パラメーターを共有するニューラル ネットワーク モデルです。
  • MMoE: この方法は、柔軟なゲーティング ネットワークを使用してエキスパート ネットワーク表現情報を調整し、最後にタワー ユニットを使用して各タスクのすべてのエキスパート ネットワーク表現情報を融合します。
  • PLE: MMoE に基づいて、モデルはエキスパート ネットワークをタスク共有エキスパートとタスク固有のエキスパートに明示的に分割し、「シーソー」現象によって引き起こされる負の転送問題を効果的に軽減します。

マルチシナリオ学習モデル:

  • HMoE: この方法は MMoE を改良したもので、複数のシナリオの予測値をモデル化し、現在のシナリオのタスク予測結果を最適化します。
  • STAR: この方法は、現在のシーンの情報表現を学習するためのスター トポロジを介して、共有されたシーン固有のネットワークを構築します。

上記の比較モデルは、もともとマルチタスク学習またはマルチシナリオ学習の問題を単純に解決するために提案されたものであることを指摘しておく必要があります。公正な実験的比較を実現するために、実験で関連する比較モデルを適応的に拡張して、マルチシナリオおよびマルチタスク モデリングのニーズを満たすようにします。

3.2 性能比較

表 2. すべてのシナリオにおける関連する比較モデルのパフォーマンス比較

表 2 は、Meituan Dafan プラットフォームでの 6 つのシナリオにおけるモデルのパフォーマンス比較を示しています。結果から、提案された HiNet モデルは、すべてのシナリオで CTR および CTCVR タスク メトリックに関して他の比較モデルよりも優れていることがわかります。これは、マルチシナリオおよびマルチタスク モデリングにおける HiNet の利点を示しています。

3.3 アブレーション研究

HiNet モデルの各主要コンポーネントの効果を調査するために、アブレーション分析用に HiNet モデルの 2 つのバリアントを設計します。詳細は次のとおりです。

  • HiNet (階層なし): 情報抽出の階層構造が取り除かれ、CGC ネットワークがマルチシナリオおよびマルチタスク学習モデリングに直接使用されることを示します。
  • HiNet (w/o SAN): シーン抽出レイヤーで SAN モジュールを削除した後の HiNet モデルを表します。

表 3 HiNet モデルのアブレーション実験結果の比較

表 3 の実験結果から、バリアント モデル HiNet (階層なし) はすべてのメトリックで深刻なパフォーマンス低下を示していることがわかります。これは、階層型情報抽出アーキテクチャがシナリオ間の共通点と相違点を効果的に捉えることができることを示しています。モデルのパフォーマンス。同様に、シーン抽出レイヤーで SAN モジュールを削除した後、バリアント モデル HiNet (SAN なし) のパフォーマンスも複数のシナリオで大幅に低下します。これは、SAN モジュールによって学習された重み情報が、シーン抽出層 情報表現能力

3.4 オンライン A/B テスト

提案した HiNet モデルのオンライン パフォーマンスをさらに検証するために、シナリオ a および b で HiNet モデルを Meituan Dafan プラットフォームに展開し、ベースライン モデルを使用して 1 か月のオンライン A/B テストを実施しました。

表 4 シナリオ a と b のオンライン A/B テストの利点

表 4 から、HiNet モデルは、複数のシナリオで CTR および CTCVR メトリックのベースライン モデルよりも優れており、注文獲得が大幅に改善されていることがわかります。これは、提案された HiNet モデルの有効性をさらに示しています。現在、HiNet モデルは上記の 2 つの事業に本格的に導入されており、事業の成長に一定の貢献をしています。

4. まとめと展望

マルチシナリオ マルチタスク モデリングは、現在のレコメンダー システムで最も重要で困難な問題の 1 つです。以前のモデルは主に、すべての情報を同じ特徴空間に射影することにより、さまざまなシナリオで複数のタスクを最適化していたため、モデルのパフォーマンスが不十分でした。

この論文では、マルチシナリオマルチタスク問題をモデル化するために階層最適化アーキテクチャを利用する階層情報抽出ネットワーク HiNet モデルを提案します。これに基づいて、シーン抽出層でシーン認識アテンション ネットワーク モジュール SAN を設計し、シーンの表現学習能力を強化します。オフラインとオンラインの両方の A/B テスト実験により、HiNet モデルの優位性が検証されます。

業界のレコメンデーション モデルにグラフ ニューラル ネットワークが多数適用されていることは、言及する価値があります。これに触発され、今後の作業で、Meituan Dafan Algorithm Team は、グラフ ニューラル ネットワークの情報転送機能をマルチシナリオおよびマルチタスク学習モデリング スキームに結合し、私たちの方法を引き続き実践し、さらに完全なモデルを設計します。 、美団から食事へのプラットフォームに存在する複雑なマルチシナリオおよびマルチタスクモデリングの問題を解決します。

著者について

Zhou Jie、Xianshui、Wen Hao、Bo Lin、Zhang Kun などはすべて Meituan Daodian/プラットフォーム技術部門の出身です。

参考文献

  • [1] P. Li、R. Li、Q. Da、A.-X. Zeng、および L. Zhang、「ラベル空間でタスク関係を利用することにより、e コマースでランク付けするためのマルチシナリオ学習を改善する」、* Information & Knowledge Management (CIKM) に関する第 29 回 ACM 国際会議の議事録、2020 年、pp . 2605–2612。
  • [2] X.-R. Sheng、L. Zhao、G. Zhou、X. Ding、B. Dai、Q. Luo、S. Yang、J. Lv、C. Zhang、H. Deng 他、「すべてに役立つ 1 つのモデル: スター トポロジーマルチドメイン ctr 予測のための適応型レコメンダー」、Proceedings of the 30th * ACM International Conference on Information & Knowledge Management (CIKM)、2021 年、pp.4104–4113。
  • [3] J. Ma、Z. Zhao、X. Yi、J. Chen、L. Hong、および EH Chi、「マルチゲート混合エキスパートによるマルチタスク学習におけるタスク関係のモデリング」、Proceedings of * 知識発見とデータ マイニングに関する第 24 回 ACM SIGKDD 国際会議 (SIGKDD)、2018 年、pp. 1930–1939。
  • [4] H. Tang、J. Liu、M. Zhao、X. Gong、「プログレッシブ レイヤード抽出 (ple): パーソナライズされた推奨事項のための新しいマルチタスク学習 (mtl) モデル」、Proceedings of the 14th ACM Conference Recommender Systems (RecSys) について、2020 年、pp. 269–278。
  • [5] L. Torrey と J. Shavlik の共著「Transfer learning」、機械学習のアプリケーションとトレンドに関する研究のハンドブック: アルゴリズム、方法、および技術。IGI グローバル、2010 年、242 ~ 264 ページ。
  • [6] SJ パンと Q. ヤン、「転移学習に関する調査」、知識とデータ エンジニアリングに関する IEEE トランザクション、vol. 22、いいえ。10, pp. 1345–1359, 2010.
  • [7] F. Zhu、Y. Wang、C. Chen、J. Zhou、L. Li、および G. Liu、「クロスドメインの推奨事項: 課題、進歩、および展望」、第 30 回人工知能に関する国際合同会議(IJCAI)。International Joint * Conferences on Artificial Intelligence, 2021, pp. 4721–4728.
  • [8] Y. Zhang および Q. Yang、「マルチタスク学習に関する調査」、知識およびデータ エンジニアリングに関する IEEE トランザクション、2021 年。
  • [9] S. Ruder、「ディープ ニューラル ネットワークにおけるマルチタスク学習の概要」、arXiv プレプリント arXiv:1706.05098、2017。
  • [10] O. Sener と V. Koltun、「多目的最適化としてのマルチタスク学習」、神経情報処理システム (NeurIPS) に関する第 32 会議、2018 年。
  • [11] C. ローゼンバウム、T. クリンガー、M. リーマー、「ルーティング ネットワーク: マルチタスク学習のための非線形関数の適応選択」、国際学習表現会議 (ICLR)、2018 年。
  • [12] J. Wang、SC Hoi、P. Zhao、Z.-Y. Liu、「オンザフライ レコメンダー システムのオンライン マルチタスク協調フィルタリング」、レコメンダー システム (RecSys) に関する第 7 回 ACM 会議の議事録、2013 年、237 ~ 244 ページ。
  • [13] R.カルアナ、「マルチタスク学習」、機械学習、vol。28、いいえ。1, pp. 41–75, 1997.
  • [14] K. Weiss、TM Khoshgoftaar、D. Wang、「転移学習の調査」、Journal of Big data、vol. 3、いいえ。1, pp. 1–40, 2016.
  • [15] N. Shazeer、A. Mirhoseini、K. Maziarz、A. Davis、Q. Le、G. Hinton、J. Dean、「とてつもなく大きなニューラル ネットワーク: 疎にゲートされた専門家の混合層」 arXiv プレプリント arXiv:1701.06538, 2017.
  • [16] D. Eigen、M. Ranzato、および I. Sutskever、「専門家の深い混合物で因数分解された表現を学習する」、コンピューター サイエンス、2013 年。
  • [17] MI ジョーダンと RA ジェイコブス、「専門家と em アルゴリズムの階層的混合」、ニューラル計算、vol。6、いいえ。2、pp。181–214、1994。
  • [18] RA ジェイコブス、MI ジョーダン、SJ ナウラン、GE ヒントン、「ローカル エキスパートの適応混合」、ニューラル計算、vol. 3、いいえ。1、79 ~ 87 ページ、1991 年。
  • [19] SE Yuksel、JN Wilson、および PD Gader、「専門家の混合の 20 年」、ニューラル ネットワークおよび学習システムに関する IEEE トランザクション、vol. 23、いいえ。8、pp。1177–1193、2012。
  • [20] Y. Zhang、C. Li、IW Tsang、H. Xu、L. Duan、H. Yin、W. Li、および J. Shao、「コールド スタートの推奨事項に対する複数のドメインによる多様な選好の増強」、 IEEE データ エンジニアリングに関する国際会議 (ICDE)、2022 年。

おすすめ

転載: blog.csdn.net/MeituanTech/article/details/129744557