Meituan-to-Store レコメンデーション広告における大規模異種グラフ リコールの適用

グラフ ニューラル ネットワークの長期的な実装において、Meituan レコメンデーション広告チームは、シーンの特性と課題を分析し、的を絞った方法でモデルを設計し、大規模なトレーニング ツールとオンライン展開の最適化を通じて何度も成功裏に実装しました。 . オンライン収入の増加。この記事では、モデル設計のアイデア、モデルの反復プロセス、大規模なトレーニング ツール、オンライン展開のパフォーマンスの最適化などを含む、Meituan の店内広告シナリオにおける大規模な画像想起技術の実践的な経験を主に紹介し、読者に関連する仕事に携わっている人 インスピレーションを得る。

1 はじめに

Meituan の店内レコメンデーション広告技術部門は、店内ケータリング、レジャーおよび親子娯楽、美容ケアなど、多くのローカル ライフ サービス ビジネスにサービスを提供しています。その中でもリコールリンクは、推奨広告システムの最初のリンクとして、多数の商品の中から質の高い候補を見つける役割を担っており、アルゴリズム最適化の核心課題の一つです。

レコメンダー システムには、2 種類の従来のリコール パラダイムがあります。ラベルベースの逆インデックス構築に基づく明示的なリコールと、ユーザーの関心のモデル ベースのエンドツーエンド モデリングに基づく暗黙的なリコールです。暗黙の想起では、ユーザーの関心を正確に特徴付けるために、過去のインタラクション動作をモデル化することが重要です。電子商取引のシナリオでは、ユーザー、マーチャント、および製品間のインタラクティブな関係は、グラフ ネットワークを通じて表現するのに適しています。従来のモデルと比較して、グラフニューラルネットワークは、ユーザーと製品間のさまざまなインタラクティブな関係を構築し、高次ネットワーク構造の推移性を使用して、ユーザーの行動の豊かさを合理的に拡張し、ユーザーの行動、ユーザーの基本的な属性を統合できます。製品コンテンツの属性やその他の異種情報が統一されたフレームワークに融合され、より大きな効果空間がもたらされます。

Meituan の推奨広告アルゴリズム チームと NLP センターのナレッジ コンピューティング チームは、推奨広告へのグラフ技術の適用に関して緊密な協力を行い、オンライン効果の大幅な改善を実現しました。本稿では主に探査プロセスと関連する実際の経験を紹介します。

2. グラフ ニューラル ネットワークの概要

グラフは、ノード自体とノード間のエッジ関係の集合として、ソーシャル ネットワークにおける人々の間の社会的関係グラフ、レコメンド システムにおけるユーザーと製品の間の相互作用グラフなど、実世界のさまざまなシナリオに広く存在します。グラフニューラルネットワークは、ノードとエッジの特性とそれらの間のトポロジー関係をキャプチャでき、グラフ構造データに優れたモデリング効果をもたらします。レコメンダー システムで一般的に使用されるグラフ ニューラル ネットワーク モデルは、グラフ ウォーク ベースの方法とグラフ畳み込みベースの方法の 2 つのカテゴリに分けることができます。

グラフ ウォークに基づく方法: 従来のニューラル ネットワーク モデルは、ユークリッド空間でのデータ処理に優れていますが、グラフ構造に含まれる複雑なトポロジー関係をモデル化することは困難です。そのため、初期の研究者は、グラフ構造のデータから walk メソッドを介してシーケンスをアップサンプリングし、次に従来のニューラル ネットワーク モデルを使用する間接的なスキームを提案しました。以下の図 1 に示すように、このタイプの方法は、グラフ内の所定のウォーキング戦略を使用してノード シーケンスを生成することに焦点を当てており、次に NLP フィールドで Skip-Gram モデルを使用してトレーニングし、各ノードのベクトル表現を取得します。

7187c515114a040045e4daabdc15f847.png

図 1 DeepWalk モデルの歩行とトレーニングのプロセス

グラフ畳み込みベースの方法: グラフからシーケンスをモデル化する方法は単純明快ですが、元のグラフ構造からシーケンスへの変換プロセスでの情報の損失により、その効果には大きな制限があるため、グラフ構造 ニューラル ネットワークへの直接モデリングは、グラフ ニューラル ネットワークの研究における重要な問題となっています。研究者は、スペクトル ドメイン グラフで信号のフーリエ変換を組み合わせ、グラフで畳み込み演算を定義し、一連の単純化によってスペクトル グラフの畳み込みをニューラル ネットワークに接続しました。

2017 年に Thomas らによって提案された GCN [3] は代表的な研究の 1 つです。図 2 は、グラフ構造から単層 GCN 式への進化を示しています。ここで、 と はそれぞれ、自己ループに追加された隣接行列とノード次数行列、グラフ ノードの特徴行列、GCN モデルのトレーニング可能なパラメーターです。 、および活性化関数 (ReLU など) は、単層 GCN ネットワークを通過した後のグラフ ノード機能の出力機能です。

f7ace91b0fe4bcd160385543cdedc833.png

図 2 単層 GCN モデルの式の進化

グラフ全体の観点から、GCN は元のグラフ構造とニューラル ネットワークの間の壁を突破しますが、計算量が膨大になるため、大規模なシナリオへの適用が困難になります。対照的に、GraphSAGE [4] は、グラフ上のノードの観点からパラダイムを渡すサンプリング ベースのメッセージを提案し、大規模なグラフ上のグラフ ニューラル ネットワークの効率的な計算を実行可能にします。GraphSAGE の SAGE は、SAmple と aggregateGateE、つまりサンプリングと集計を指します。以下の図 3 は、GraphSAGE のサンプリング集計プロセスを示しています。図の左側は、2 層サンプラーを使用してその 1 次および 2 次の近傍をサンプリングすることを示しています.図の右側は、サンプリングされた 1 次および 2 次の近傍の特性が、ノードを取得するための対応する集約関数 A の表現、次に A の表現を使用して、ノードの分類、リンクの予測、グラフの分類など、さまざまなグラフ関連のタスクを計算できます。

46568139e7e286da00895739cc3973af.png

図 3 GraphSage モデルのサンプリングと集計プロセス

GraphSAGE などのメッセージ パッシング パラダイムに基づくグラフ ニューラル ネットワーク手法の場合、セントラル ノードによって集約できる機能の範囲は、サンプリングされた隣接ノードの順序によって異なります。このタイプのグラフ ニューラル ネットワーク トレーニングを使用する場合、ノードの固有の特性をモデル入力として使用することに加えて、各ノードに独立したトレーニング可能なベクトル パラメーターを追加して、高次の隣接ノードの相関をより適切に学習することもできます。

上記の方法以外にも、グラフニューラルネットワーク分野は研究のホットスポットの一つであり、近年、GAT[5]、FastGCN[6]、GIN[7]など優れたアルゴリズムが続々と登場し、 Pinterest[8] や Alibaba など [9] や Tencent [10] などで採用されており、大規模なレコメンド シナリオで優れた成果を上げています。

3. ビジネス シナリオと課題

トラフィック側では、店舗内推奨広告ビジネスは、主に美団/点平の両側の情報フロー広告や詳細ページ広告などのさまざまなビジネス シナリオをカバーし (下の図 4 に示すように)、供給側にはケータリング、ビューティーが含まれます。医療美容、レジャー・娯楽、結婚、親子などの広告主カテゴリーがあり、各カテゴリーには、加盟店、グループ注文、一般商品など、さまざまな推奨候補タイプが含まれています。

fcc6c867f6936a2a9bf86120ec110cfc.png

図 4 Meituan の店内レコメンド広告の主なビジネス シナリオ: 情報フロー広告 (左)、詳細ページ広告 (右)

ビジネスにおけるリコール モデルのモデリングは、次の 2 つの課題に直面しています。

a.同じシーンでのフィードバック データが少ない: 従来のシーケンシャル動作モデリング スキームは、同じシーンでのユーザー フィードバック データに依存して、モデル トレーニング用のポジティブ サンプルとネガティブ サンプルを構築しますが、推奨される広告シーンでのユーザー インタラクション動作は比較的まばらです.統計によると、過去 90 日間に広告クリック行動がなく、広告された製品の 40% 以上が過去 1 か月間クリックされていません。ユーザーの関心の不正確な特徴付けと、まばらなフィードバック データによって引き起こされるロングテール製品の不十分な学習をどのように解決するかは、私たちが直面している大きな課題です。

b. LBS ビジネスにおけるさまざまな時間と空間のシナリオでの関心の描写: インストア ビジネスでは、ユーザーはさまざまな時間と空間でブラウジング行動のまったく異なる好みを持っていることがよくあります。たとえば、平日は会社の近くにいるユーザーは便利な仕事の食事に興味があるかもしれませんし、休暇中は家で赤ちゃんを連れて行くのに面白い場所を見つけたいかもしれません。ただし、従来のグラフ ニューラル ネットワークでは、ユーザー リクエストの時間と場所をリアルタイムで認識できません。したがって、グラフに含まれる豊富な情報から現在の時空間シーンに適合する候補セットをどのようにマイニングするかも大きな課題です。

上記のビジネス特性と課題を考慮して、フル シナリオ データの高次関係に基づいて大規模な異種グラフ モデリングを設計し、シーン全体の豊富な行動データの助けを借りてスパース性の問題を最適化しました。の。

4. レコメンド広告における画像想起技術の進化

4.1 フルシナリオデータの高次関係に基づく大規模異種グラフモデリング

チームの以前の想起モデルは、広告シーンでのユーザーの行動に基づいてポジティブ サンプルとネガティブ サンプルを構築することによってのみトレーニングされていました.この方法により、トレーニング データと予測シーンの間の一貫性が改善されましたが、ユーザーの興味や関心の不正確な記述が避けられませんでした.ロングテール製品の推奨. 効果の低さおよびその他の問題. 特に、レコメンドシステムの最上流リンクであるリコールは、リンク効果全体の最適化の上限を決定するものであり、グラフニューラルネットワークの強力な表現力により、ユーザーの興味や商品情報をベースに総合的に記述することが期待されます。シーン全体のユーザー行動データ。

図 5 に示すように、グラフ ネットワークは、ユーザー (ユーザー) と製品 (アイテム) の暗黙的な表現 (埋め込み) をそれぞれ生成し、距離の類似性によって候補広告に対するユーザーの潜在的な関心を測定します。グラフ ニューラル ネットワークの選択では、Attention 構造を持つ GAT[5] を使用して、ソース ノードへの重要度に応じて隣接情報の寄与を適応的に調整し、ミスクリックによるノイズを抑制し、Jumping Knowledge Network を使用します [ 11]は、ノードの接続性に応じてアグリゲーションネットワーク範囲を自己調整し、広範な接続性アグリゲーション範囲による人気のあるノードのパーソナライズされた情報の損失を回避します.

5225aac82ccf3081eca77f941df7a84e.png

図 5 フルシナリオ データの多次関係に基づくグラフ モデリング

フルシナリオ データ モデリング: ユーザーの興味や好みを完全にマイニングするために、フルシーンの行動データを介してモデリングするための超大規模異種グラフ ネットワークを構築しました。ここでの完全なシーンは、完全なビジネス (検索、推奨、広告)、完全な場所 ​​(ホームページ、製品詳細ページ、グループ注文詳細ページ)、およびすべての製品タイプ (マーチャント、グループ注文、汎商品など) をカバーします。異種グラフには、ユーザー (User) とアイテム (Item) の 2 種類のノードが含まれ、ユーザーがアイテムをクリックする、アイテムが一緒にクリックする、アイテムが同じストアを共有する、3 種類のエッジによって接続されます。

各シーン間のフルシーン データに含まれる豊富な情報の効果的な転送を強化すると同時に、広告シーンにおけるユーザーの固有の関心特性を区別するため。グラフ作成プロセス中、広告シーンと非広告シーンの同じアイテムを異なるノードとしてモデル化し、同じ非広告機能を共有しますが、広告ロゴのあるノードは広告固有の機能を追加します。このようにして、トレーニングプロセス中に、モデルは共有機能を介して非広告シーンの情報を転送するだけでなく、広告シーンでのユーザー固有の興味の好みを学習することもできます。グラフが作成されると、数億のノードと数千億のエッジが含まれます。

6f0f1b68b4fe3c8d2fcecfd09350ad11.png

図 6 全体シーン グラフの構築プロセス

グラフ クロッピングとノイズ抑制: 上記の異種グラフは、シーン全体のユーザーの行動データをカバーしており、データ スケールが巨大であるため、実際の実装に巨大な計算能力とパフォーマンスの課題がもたらされます。グラフのトポロジ構造では、各ノードの次数分布が非常に不均一であり、いくつかの人気のあるノードの隣接ノードの数が数十万に達することがわかりました.各ノードは一定数の隣接ノードのみをサンプリングして参加するため、トレーニング プロセス中の計算では、ネイバーが多すぎるとノイズの多いデータが大量に発生し、不要なリソース オーバーヘッドも発生します。グラフ データの背後にあるビジネス上の理解に従って、元のトポロジを合理的に調整します。

具体的には、「ユーザーがアイテム エッジをクリックした」の場合は、上位 N のアウトバウンド エッジを比較的最近の動作時間で保持し、「アイテムの一般的にクリックされたエッジ」の場合は、上位 N のアウトバウンド エッジをより高いエッジ ウェイトで保持します。グラフがクリップされた後、ノードの数は同じままで、エッジの数が 46% 減少し、トレーニング メモリのオーバーヘッドが 30% 減少し、オフラインの Hitrate 効果が約 0.68% 改善されました。

08603a7defe348b5daf3e4ebc00ffc3b.png

図 7 画像の切り抜き例 (設計上の a > b > c)

動的ネガティブ サンプル サンプリング: 広告業者はすべての業者に占める割合が小さいため、フル シナリオの行動データを導入すると、トレーニング サンプル空間が 1 桁増加し、SSB (サンプル選択バイアス) 問題がさらに悪化します。ネガティブ サンプル サンプリング戦略は、モデルの有効性に影響を与える重要な要素になります。一般的なランダム ネガティブ サンプリング法では、ハード ネガティブ サンプル サイズが不十分なため、実際の予測におけるモデルの一般化が不十分になります。LBS シナリオでの距離とカテゴリの構築に基づく一般的なネガティブ サンプルなどの静的なネガティブ サンプル サンプリング戦略は、一定の効果の改善を達成できますが、その汎用性は低く、ポリシーの構成は面倒であり、移行して適応的に反復することはできません。ユーザーの興味に。

グレードの異なる都市を例にとると、ユーザーは距離やカテゴ​​リに対する好みが異なるため、異なるしきい値を設定する必要があります。したがって、半教師あり学習に基づく反復トレーニング パラダイムを提案します。モデルの前のラウンドによって出力されたマーチャントの埋め込みは KMeans によってクラスター化され、ハード ネガティブはポジティブ サンプルが配置されているクラスター セットでサンプリングされ、次のラウンド. のトレーニング サンプルでは、​​このステップ サイクルに従って、モデルを継続的な「自己改善」に導きます。

実験では、イテレーション ラウンドの増加に伴い、オフライン インジケーターの限界利益が縮小することがわかっています。トレーニング速度と収益のバランスを考慮して、オンラインで 2 回のイテレーションを使用します。ランダムなネガティブ サンプリングと比較すると、この最適化はオフラインのヒット率効果で約 4.66% の改善をもたらし、静的なネガティブ サンプル戦略 (距離とカテゴリに基づくサンプリングなど) と比較して、オフラインのヒット率効果で約 1.63% の改善をもたらします。

edea86255ae78d7a2277db4b503a6e4c.png

図 8 ダイナミック ネガティブ サンプル サンプリング プロセス

上記の 3 つの最適化ポイントの繰り返しが複数の主要な広告掲載位置に実装され、広告収益を測定する RPS (検索あたりの収益) 指標が約 5% から 10% 増加しました

4.2 強化された時空間情報認識のためのエンドツーエンドの異種グラフ モデリング

LBS ビジネスにおいて、時空間情報はユーザーの興味を左右する重要な要素です。ユーザーは通常、安定した長期的な関心を持っていますが、現在の時空間情報の影響により、変化する短期的な関心を示すこともあります。したがって、セクション 4.1 で導入されたフルシーンの異種グラフ モデリングに基づいてアップグレードします。安定した長期的関心と変化する短期的関心の特性に従って、長期的および短期的関心に対する時空間情報の影響をそれぞれモデル化するための的を絞った測定を採用します。

以下の図 9 に示すように、時空間サブグラフを通じてさまざまな時空間シナリオでのユーザーの長期的な関心の好みを説明し、複数の連続モデリングを通じて短期の時空間シナリオでのユーザーの関心の進化を説明します。 -因子の相乗的活性化。静的機能として異種グラフの事前トレーニング埋め込みを導入する 2 段階のトレーニング方法とは異なり、同じ最適化目標の下でモデルの各部分に対して 1 段階のエンド ツー エンドのトレーニングを行うことに注意してください。最適化目標の不一致を回避する効果の損失。

466327f3baf76ed71151b67450be50e0.png

図 9 時空間情報の認識を強化するためのエンドツーエンドの異種グラフ モデリング

時空間サブグラフの構築と多視点融合: 平日はオフィスでコーヒーを注文し、休みの日はジムでスポーツをするなど、ユーザーは時間と空間によって異なる興味を示します。グローバルな視点からのグラフモデルのみを使用してユーザーのグローバルな関心を抽出すると、異なる時間と空間でのユーザーの関心の違いが失われやすくなります。従来のグラフ モデル スキームは、グローバルな情報を通じてユーザーの統一された関心表現を取得し、さまざまな時空間シナリオにおけるユーザーの関心の違いを正確に説明することはできません。

STGCN [12] など、時空間情報を組み合わせたグラフ表現学習の方向でいくつかの研究が行われています。関連業務をもとに、広告をレコメンドするビジネスシナリオから出発し、ユーザーの行動に対応する時空間情報をもとに、時間、空間、時空間、グローバルの4つの視点からサブグラフを構築し、マルチ-view fusion モジュール ユーザーからの長期的な関心を獲得します。Item 間の関係 (ストア、一般的なクリックなど) は比較的安定しており、時間的および空間的な変化の影響を受けにくいため、すべてのサブグラフが Item2Item エッジを共有することに注意してください。

以下の図 10 に示すように、ユーザー リクエストが到着すると、現在の場所に対するユーザーの関心が空間サブグラフから取得され、複数回のユーザーの関心が時間サブグラフから取得され、ユーザーの現在の場所が時刻から取得されます。 & space subgraph. マルチビュー フュージョンのために、グローバルな関心と現在の時間と組み合わせた、場所の下の複数時間の関心。実際には、時間を朝、午後、夕方、深夜の 4 つの時間帯に分割し、Geohash を使用して場所を複数の地理的領域に分割します。統計によると、各ユーザーの履歴行動に関与する期間と地理的領域は比較的集中しており、ストレージスペースに過度の圧力をかけることはありません. 時空間サブグラフの構築と融合により、オフラインでのヒット率が約 3.65% 向上しました。

8a5e5f243be68d337f97cf1ecac8c488.png

図 10 マルチビュー フュージョン

ユーザーシーケンスモデリングの多要素協調活性化:時間情報(現在時刻と行動シーケンス時間の差)と位置情報(現在位置と行動シーケンス位置の差)をアクティベーション要因として、短期的な行動シーケンスを活性化し、ユーザーを獲得します時間と空間における関心の移行傾向。さらに、グラフ ニューラル ネットワークによって出力されるユーザーの長期的な関心ベクトルは、時間、場所、およびその他の次元でユーザーの比較的安定した関心の好みを反映し、現在の時空間シーンに一致するリアルタイムの関心を短期から抽出するのにも役立ちます。タームシーケンス。時空間情報とユーザーの長期的な関心を使用して、ユーザーの短期的な行動シーケンスを活性化する場合、複数の要因の調整された活性化が必要になります.業界で一般的なソリューションは、以下の図11に示されています:

288d7288a35cb9c4f4b02ff42f8357be​​.png

図 11 複数の因子の相乗的活性化

Meituan LBS のビジネス シナリオでは、さまざまな活性化要因が相互に作用する可能性があります。多因子活性化の最良の効果を達成するために、オフラインインジケーターと組み合わせて「多因子融合活性化」モードを選択します。多要素協調アクティベーションのユーザー シーケンス モデリングは、約 6.90% のオフライン ヒットレートの改善をもたらします。

グラフニューラルネットワークによってマイニングされた多次関係は、ユーザーシーケンスの表現を豊かにすることができることに言及する価値があります. このマルチレベルの関係は、商品と商品、ユーザーと商品などの粗粒度のノード間だけでなく、時間、場所、カテゴリなどの細粒度のフィーチャ間にも反映されます。したがって、グラフニューラルネットワークの製品ノードが埋め込みディクショナリを機能次元のユーザー行動シーケンスと共有できるように機能出力プロセスをアップグレードし、統一された最適化目標に基づくエンドツーエンドのトレーニングがうまくいくようにしました-グレイン化されたマルチレベル情報 グラフ ニューラル ネットワークとユーザー シーケンスとの間の転送が改善されました。

上記の 2 つの最適化ポイントの繰り返しが複数の主要な広告掲載位置に実装され、広告収益を測定する RPS (検索あたりの収益) 指標が約 5% 増加しました

5. パフォーマンスの最適化と適用

大規模なシナリオでオンラインになり、リアルタイムのリコールを実行できるようにするために、モデルのオフライン トレーニングとオンライン展開を最適化しました。

aa529b464b74235bc6da694bea7d45a2.png

図 12 パフォーマンスの最適化と適用

LBS シナリオに適応した大規模なグラフ ニューラル ネットワーク トレーニング フレームワーク: 業界でのグラフ ニューラル ネットワークの普及に伴い、Euler や DGL などの多数の優れたグラフ ニューラル ネットワーク トレーニング フレームワークがオープン ソース コミュニティに登場しました。オープン ソース フレームワークに基づいて、社内のビッグ データと機械学習プラットフォームを一致させ、LBS シナリオに適した大規模なグラフ ニューラル ネットワーク トレーニング フレームワークを開発しました。このフレームワークは、大規模なグラフの構築、特徴抽出、およびその他の構成操作をサポートし、追加の開発により、「位置情報の動的サンプリング」を含む一般的な LBS グラフ ニューラル ネットワーク操作がサポートされます。このフレームワークを通じて、複数のビジネス シナリオでオンライン モデルを実装してきました。その中で最大規模は、数億のノード、数千億のエッジ、およびサイド情報を持つグラフ ニューラル ネットワーク モデルです。

低遅延のオンライン コンピューティング プロセス: リコール リンクは、広告推奨システムの最初のファネルであり、限られた時間内に大量の候補広告から高品質のサブセットを選択し、それを下流に渡す必要があります。サブグラフ検索やグラフ畳み込みなどのオンラインで時間のかかる複雑な操作の大きな課題を考慮して、低レイテンシのオンライン コンピューティング プロセス最適化スキームを提案します。セクション 4.2 で紹介したモデルでは、グラフ モデル部分は主にユーザーの長期的な関心 , リアルタイムの動作やリクエスト情報に影響されない. したがって, グラフノード埋め込みをオフラインで計算し、それをKVテーブルに保存して、グラフモデルのオンライン導出が時間のかかるものになるのを回避します.ボトルネック. 同時に、グラフノードの埋め込みと他の機能は、オンラインリクエスト中に並行して処理されます. 抽出プロセス. 実際には、上記の最適化とリコール プロセスの後、オンラインでの時間のかかる増加は 2% 未満であることが示されています。

6. まとめと展望

グラフ ニューラル ネットワークは、グラフ構造のデータに対する優れたモデリング能力を持ち、グラフ ノードの高次隣接情報を十分に活用でき、大規模レコメンデーション システムのリコール モジュールで大きな可能性を示しています。それぞれの事業を組み合わせた特徴的なグラフモデルの実践[8][9][10]。

本稿では、美団から店舗へのレコメンデーション広告における大規模画像想起技術の適用について紹介します。店舗で推奨される広告シーンの特徴を分析し、マップリコール技術を実装する際に、それに応じた最適化を実施しました。モデルに関しては、まばらな広告フィードバック データの問題を解決するために、シーン全体のデータをグラフ モデルに統合して、ユーザーの関心の表現を豊かにし、グラフ クロッピングおよび動的ネガティブ サンプル サンプリング技術と組み合わせて、累積Hitrate の増加は約 5.34% でした.時間と空間などの LBS 動的シーン情報を知覚するために、時空間サブグラフ モジュールを使用して、さまざまな時間と空間でのユーザーの関心を記述し、マルチビュー フュージョンと約10.55%の累積増加を伴う、長期および短期の配列融合。オフライン トレーニングとオンライン コンピューティング パフォーマンスの最適化と協力して、複数の主要な広告掲載位置を獲得することに成功し、オンライン RPS は 10% ~ 15% 増加しました。

将来的には、次の技術的方向性を探求し続けます。

1. マルチシナリオの知識伝達

店内広告のシナリオは数多くあり、広告の位置ごとに異なるグラフ再現モデルを維持するための維持コストは比較的高くなります。マルチシナリオの共同トレーニングは、グラフ データを充実させ、ユーザーの関心の説明を改善するだけでなく、単一のグラフ リコール モデルをさまざまな広告位置に適用して、メンテナンス コストを削減することもできます。ただし、異なる広告位置の下でのユーザーの行動には違いがあり、不適切なデータ融合はノイズの導入につながり、モデルのトレーニング結果に影響を与える可能性があります。モデル設計において、さまざまな広告掲載位置の下でのユーザーの行動の共通点と相違点をどのように説明するかが重要な考慮事項です。

2. 動的グラフ技術

ユーザーの関心は、時間と空間の経過とともに常に変化しています。動的グラフ モデルは、時間や空間などの動的な情報をグラフ構造に組み込むことができ、長期的な関心と短期的な関心を人為的に分割することに比べて、動的グラフはユーザーの関心の変化をより柔軟に認識し、LBS サービスの特性に適合させることができます。 .

7. 著者について

  • Qi Yu、Li Gen、Shaohua、Zhang Teng、Cheng Jia、Lei Jun は Meituan Daodian Business Group/Advertising Platform Technology Department に所属しています。

  • Xiangzhou、Mengdi、および Wuwei は、Meituan プラットフォーム/検索推奨アルゴリズム部門の NLP センターの出身です。

8.参考文献

[1] ペロッツィ、ブライアン、ラミ・アル=ルフー、スティーブン・スキエナ。「ディープウォーク: 社会的表象のオンライン学習」。知識発見とデータ マイニングに関する第 20 回 ACM SIGKDD 国際会議の議事録。2014年。

[2] グローバー、アディティア、ジュレ・レスコベック。「node2vec: ネットワークのスケーラブルな機能学習。」知識発見とデータ マイニングに関する第 22 回 ACM SIGKDD 国際会議の議事録。2016年。

[3] Welling、Max、および Thomas N. Kipf。「グラフ畳み込みネットワークによる半教師付き分類」J.学習表現に関する国際会議。ICLR、2017年。

[4] ハミルトン、ウィル、ジタオ イン、ジュレ レスコベック。「大きなグラフでの帰納的表現学習」神経情報処理システムの進歩 30 (2017)。

[5] Velickovic、Petar、他。「アテンション ネットワークをグラフ化する」学習表現に関する国際会議。2018年。

[6] 陳、杰、馬騰飛、曹操。「FastGCN: 重要度サンプリングによるグラフ畳み込みネットワークによる高速学習」。学習表現に関する国際会議。2018年。

[7] Xu、Keyulu、他。「グラフ ニューラル ネットワークはどれほど強力なのか。」学習表現に関する国際会議。ICLR、2019年。

[8] イン、レックス、他。「Web スケールのレコメンダー システム用の畳み込みニューラル ネットワークをグラフ化します。」知識発見とデータ マイニングに関する第 24 回 ACM SIGKDD 国際会議の議事録。2018年。

[9] Wang、Menghan、他。「M2GRL: Web スケールのレコメンデーション システム用のマルチタスク マルチビュー グラフ表現学習フレームワーク。」知識発見とデータ マイニングに関する第 26 回 ACM SIGKDD 国際会議の議事録。2020年。

[10] Xie、Ruobing、他。「多様化した嗜好ネットワークとのレコメンドマッチングの精度と多様性を向上させる」ビッグデータに関する IEEE トランザクション (2021 年)。

[11] Xu、Keyulu、他。「ジャンピング知識ネットワークによるグラフの表現学習」機械学習に関する国際会議。PMLR、2018年。

[12] ハン・ハオユ他 "STGCN: POI レコメンデーションのための時空間認識グラフ学習手法"。2020 年 データ マイニングに関する IEEE 国際会議 (ICDM)。IEEE、2020年。

- - - - - 終わり - - - - -

チームプロフィール

Meituan のインストア広告アルゴリズム チームは、インストア関連ビジネスの広告アルゴリズムを最適化する責任を負い、広告業者のユーザー エクスペリエンスと ROI を確保することを前提として、商業トラフィックの収益化効率を継続的に改善します。主な技術的方向性には、トリガー戦略、品質推定、メカニズム設計、アイデア生成、アイデア最適化、不正行為防止、マーチャント戦略などが含まれます。チームは強力な技術的雰囲気を持ち、最先端技術の継続的なブレークスルーを通じて継続的なビジネス開発を推進し、人材トレーニングを非常に重視し、メンバーの急速な成長を支援する完全で成熟したトレーニングメカニズムを備えています。

美団科学研究協力

Meituan の科学研究協力は、Meituan の技術チームと大学、科学研究機関、シンクタンクの間の協力のための架け橋とプラットフォームの構築に取り組んでおり、Meituan の豊富なビジネス シナリオ、データ リソース、および実際の産業問題に依存し、オープン イノベーションが上向きの力を集めています。 、ロボット、人工知能、ビッグデータ、モノのインターネット、無人運転、運用の最適化などの分野に焦点を当て、最先端の技術と業界が注目するマクロの問題を共同で調査し、産学研の協力と交流と成果の変革を促進します。優れた才能の育成を促進します。将来に向けて、大学や研究機関のより多くの教師や学生と協力することを楽しみにしています。教師と生徒は、[email protected] にメールを送ってください。

多分あなたは見たいです

Meituan Waimaiの下でのシナリオベースのアプリケーションとグラフ  技術 の探求

  |  Meituantu ニューラル ネットワーク トレーニング フレームワークの実践と探索

  |  KDD Cup 2020 自動地図学習大会チャンピオン 美団広告の技術ソリューションと実践

続きを読む

フロントエンド |アルゴリズム |バックエンド | データ   

セキュリティ |  Android  |  iOS   | 運用・保守 | テスト

おすすめ

転載: blog.csdn.net/MeituanTech/article/details/128030368