KDDカップ2020デバイアス競争チャンピオンの技術計画と美団広告におけるその実践

ACM SIGKDD(データマイニングと知識発見に関する国際会議、略してKDD)は、データマイニングの分野でトップの国際会議です。

 

独自のビジネスシナリオに基づいて、Meituan to-store広告プラットフォームの検索広告アルゴリズムチームは、最先端のテクノロジーを継続的に最適化および革新してきました。チームの強みである中国科学院大学のHuKe、Qi Yi、Qu Tan、Ming Jian、Bo Hang、Lei Jun、Tang Xingyuanが共同でチームAisterを結成し、Debiasing、AutoGraph、MultimodalitiesRecallの3つに参加しました-トラックの問題、そして最終的にデバイアス回路(1/1895)でチャンピオンシップを獲得し、オートグラフトラックでもチャンピオンシップ(1/149)を獲得し、マルチモダリティリコールトラック(3/1433)で3位を獲得しました。

この記事では、デバイアス競争の質問の技術的解決策、および広告ビジネスにおける逸脱の排除におけるチームのアプリケーションと研究を紹介します。

バックグラウンド

KDDカップは、SIGKDDが主催するデータマイニング研究の分野でトップの国際イベントです。1997年から毎年開催されており、現在、データマイニングの分野で最も影響力のあるイベントです。このコンテストは、ビジネス界と学術界の両方を対象としており、世界のデータマイニング業界のトップエキスパート、学者、エンジニア、学生が参加し、データマイニングの実践者に学術交流と研究結果の表示のためのプラットフォームを提供します。KDDカップ2020には、データバイアス(バイアス除去)、マルチモダリティリコール(マルチモダリティリコール)、自動グラフ学習(AutoGraph)、敵対的学習問題、強化学習問題を含む、合計5つの競争質問(4つのトラック)があります。

図1KDD2020会議

広告システムでは、データの逸脱をどのように排除するかが最も難しい問題の1つであり、近年の学術界の研究のホットスポットでもあります。製品形態とアルゴリズム技術の継続的な進化により、システムは偏差を蓄積し続けます。検索連動型広告アルゴリズムチームは、データ偏差の問題に突破口を開き、業績を大幅に改善しました。特にデバイアス競技では、偏差除去問題の技術的蓄積に基づき、世界1895チームの激しい競争で1位を獲得し、最終評価指数(ndcg_half)が6.0%で2位を獲得しました。以下では、デバイアス競争の質問の技術的解決策、および広告ビジネスにおける逸脱の排除に関するチームのアプリケーションと研究を紹介します。関連する研究に従事する学生に役立つか、刺激を与えることを願っています。

添付ファイル:テクニカルソリューションのオープンソースコード

図2KDDカップ2020デバイアス競争トップ10リスト

競争の質問の紹介と問題分析

偏差除去の問題の概要

ほとんどのeコマースおよび小売企業は、大量のデータを使用してWebサイトに検索および推奨システムを実装し、販売を促進しています。この傾向の進展とトラフィックの大幅な増加に伴い、推奨システムにはさまざまな課題が生じています。調査する価値のある課題の1つは、レコメンデーションシステム[1,2]における人工知能の公平性の問題です。つまり、機械学習システムに短期的な目標(短期的なクリック、トランザクションなど)が備わっている場合、単純に短期的な目標に合わせて最適化すると、深刻な「マシュー効果」につながります。つまり、人気のある製品がより注目され、人気のない製品がますます忘れられ、システムの一般的な逸脱が発生します[3]。モデルとシステムは繰り返し依存しますページビューデータに基づいて、露出データはモデルによって選択された実際の候補のサブセットです。トレーニングのためにモデルによって選択されたデータとフィードバックに継続的に依存すると、選択的なバイアスが形成されます[3]。

上記の人気バイアスと選択バイアスの蓄積は、システムの「マタイ効果」をますます深刻にするでしょう。したがって、人工知能の公平性は、レコメンデーションシステムの継続的な最適化にとって非常に重要であり、これはレコメンデーションシステムの開発と生態環境に大きな影響を及ぼします。

これは明確に定義された最適化問題ではないため、バイアス除去は現在のレコメンダーシステムでは非常に困難な問題であり、現在の学界の研究ホットスポットでもあります。このKDD競争は、偏りのない推定のためのeコマースにおける次のアイテムの予測(次のアイテムの予測)の問題に基づく偏差の問題にも基づいています。

コンテストの担当者は、ユーザーのクリックデータ、製品のマルチモーダルデータ、およびユーザーの特性データを提供します。その中で、ユーザークリックデータは、ユーザーが履歴でクリックした商品とクリックのタイムスタンプを提供します。商品マルチモーダルデータは、主に商品のテキストベクトルと画像ベクトルであり、ユーザー特性データにはユーザーの年齢、性別、都市など。データには、100万回以上のクリック、10万件の製品、3万人のユーザーが含まれていました。時間枠に応じて、データステージは10ステージに分割され、最終スコアは最後の3ステージに基づいています。

バイアスの問題を排除することに焦点を当てるために、このコンテストの質問で提供される評価指標には、NDCG @ 50_full、NDCG @ 50_half、hitrate @ 50_full、hitrate @ 50_halfが含まれます。評価には、NDCG @ 50_fullとNDCG @ 50_halfの2つの指標が使用されます。

  • NDCG @ 50_full:通常のレコメンデーションシステム評価指標NDCGと一致して、各ユーザーリクエストによって推奨された上位50の製品リストの平均ランキング効果が評価データセット全体で評価されます。この評価セットは完全評価セットと呼ばれます。

  • NDCG @ 50_half:バイアスの問題に焦点を当て、過去の露出がほとんどないクリックされた製品の半分が完全な評価データセット全体から取得され、これらの製品の推奨リストがNDCGインデックスによって評価されます。評価セットは半評価セット。

スコアリングでは、最初にNDCG @ 50_fullを介して上位10%のチームが選択され、次にこれらのチームの中からNDCG @ 50_halfが最終ランキングに使用されます。最終評価では、NDCG @ 50_halfが上位ランキングの違いを評価し、ロングテールデータ予測でより重要な評価方法を使用すると、プレーヤーのデータ偏差の最適化をより適切に評価できます。従来のクローズドデータセットのヒット率推定問題(CTR推定)とは異なり、上記のデータ特性と評価方法は、偏差の最適化に焦点を当てています。

データ分析と問題理解

データ分析と問題点:ユーザー特性データには合計35444人のユーザーがいますが、6789人のユーザーしか特性を持っていないため、特性カバレッジ率は19.15%にすぎません。カバレッジ率が低く、年齢の特性が3つしかないため、性別、都市、これらの機能は私たちのタスク全体には役に立たないことがわかります。商品特徴データには合計117720点の商品があり、108,916点の商品にテキストベクトルと画像ベクトルがあり、カバー率は92.52%と高い。商品間のテキスト類似性と画像類似性はベクトルに基づいて計算できる。ユーザー情報と製品情報の違いに欠けているため、これらの商品マルチモーダルベクトルをどのようにうまく利用するかは、タスク全体にとって非常に重要です。

選択的バイアス分析:表1に示すように、i2i(item2item)クリックの共起に基づくリコールされた製品候補セットと、2つのアイテムベースの協調フィルタリング方法に基づくi2iベクトルの類似性を比較します。システムパフォーマンスの制限により、候補セットの最大長を1000に制限すると、2つのリコール方法の評価セットでのヒット率が低くなり、どちらの方法を使用しても、システムの選択バイアスが大きくなります。つまり、推奨ユーザーに提供されるサンプルは、すべての候補セットではなく、システムに従って選択されます。真の候補セットは、ユーザーに推奨されるサンプルを大幅に上回っているため、トレーニングデータに選択的なバイアスが生じます。

さらに、i2iクリックに基づくと、半分の評価セットに比べて完全な評価セットのヒット率が高く、人気のある製品を好むことを示し、i2iベクトルの類似性に基づく完全な評価セットと半分の評価セットのヒット率が高いことがわかりました。は同じです。つまり、人気を優先しないということです。同時に、2つの方法でリコールされた候補セットの繰り返し率は4%しかないため、クリックの同時発生という2つの製品関係を組み合わせる必要があります。より大きなトレーニングセットを生成するためのベクトルの類似性により、選択性の偏りが軽減されます。

表1i2iクリックの共起とi2iベクトルの類似性のヒット率を思い出してください

図3に示すように、商品の人気を分析しました。横軸は商品のクリックの頻度、つまり商品の人気であり、縦軸は商品の数です。この図では、人気を切り捨てており、最大横軸は228になっているはずです。ほとんどの商品の人気が低く、ロングテール分布に一致していることがわかります。図の2つの箱ひげ図は、完全な評価データセットでの製品の人気の分布と、半分の評価データセットでの製品の人気の分布です。これらの2つの箱ひげ図から、データセットに人気バイアスが存在することがわかります。完全な評価セット全体の評価データの半分は人気の低い製品に基づいており、評価データ製品の残りの半分は高い製品に基づいています。人気。サンプルを作成するために製品をクリックすると、データ内でより人気のあるポジティブな製品が生成され、人気のある偏差が発生します。

図3商品の人気偏差

問題の挑戦

この競争の主な課題は、レコメンデーションシステムのバイアスを排除することです。上記のデータ分析から、バイアスには、選択バイアスと人気バイアスの2つの主要なタイプがあることがわかります。

  • 選択的バイアス:曝露データはモデルとシステムによって選択され、システム内のすべての候補セットと矛盾しています[4,5]。

  • 人気の偏差:製品の過去のクリック数はロングテールの分布を示します。したがって、人気の偏差はヘッド製品とテール製品の間に存在します。人気の偏差を解決する方法も競争の中心的な課題の1つです[ 6,7]。

上記の偏差に基づいて、ページビュー(露出)->クリック(クリック)クリック予測モデリングのアイデアの従来の使用では、ユーザーの本当の興味を合理的にモデル化することはできません。予備的な試みでは、従来のモデリングのアイデアはあまり効果的ではないこともわかりました。 。従来のユーザーインタレストモデリングのアイデアとは異なり、まず、u2i2i(user2item2item)モデリング変換を使用し、従来のCTR推定方法u2i(user2item)インタレストモデリングの代わりにi2iモデリングを使用します。さらに、Pageviewサンプルに基づいてアイデアを生成する代わりに、i2iグラフに基づくマルチホップウォークを使用して候補サンプルを生成します。同時に、構成プロセスとi2iモデリングプロセスに人気ペナルティを導入しました。最後に、上記の逸脱の課題は効果的に解決されました。

競争技術ソリューション

選択性の偏差と人気の偏差の課題を目指して、上記の偏差を効果的に最適化するためのモデリング設計を実施しました。既存のCTRモデリング方法は、u2iのモデリングとして理解できます。これは通常、特定のリクエストコンテキストでの候補製品に対するユーザーの好みを表します。モデリング方法は、クリックされた各製品と候補製品のユーザーの履歴を学習することです。 u2i2iのモデリングとして理解されています。このモデリング方法は、さまざまなi2i関係を学習するのに役立ち、i2iグラフの1ホップ関係をマルチホップ関係に簡単に拡張できます。複数のi2i関係は、より偏りのないデータを探索して、製品候補セットを増やすことができます。トレーニングセットは、選択性の偏りを軽減するという目的を達成します。

同時に、人気商品による人気偏差を考慮し、構成過程でエッジウェイトに人気ペナルティを導入し、マルチジャンプ時やで人気の低い商品を探索する機会を増やしました。モデリングプロセスと後処理で同時に人気の偏差を緩和するために、人気ペナルティも導入しました。

最終的に、i2iモデリングに基づいてソートフレームワークを形成しました。フレームワーク図を図4に示します。私たちのフレームワークでは、製品推奨プロセスは3つの段階に分かれています。最初の段階は、ユーザー行動データと製品マルチモーダルデータに基づいてi2iマップを作成し、i2iマップに基づいてマルチホップウォークを実行してi2i候補を生成することです。サンプル;最初の段階は、ユーザーのクリックシーケンスを分割し、i2i候補サンプルに基づいてi2i関係サンプルセットを構築し、i2iサンプルセットに基づいて自動機能エンジニアリングを実行し、人気加重損失関数を使用して人気の排除をモデル化することです。バイアス;第3段階ユーザーのクリックシーケンスに従って、i2iモデルによって生成されたi2iスコアが集計され、スコアリングされた製品リストが後処理されて人気の偏差が排除され、製品リストがランク付けされて推奨されます。3段階のプランを詳しくご紹介します。

図4i2iモデリングに基づくソートフレームワーク

マルチホップウォーキングに基づくi2i候補サンプルの生成

i2iモデリングのi2iバイアスのない候補サンプルをさらに探索し、それによって選択バイアスを軽減するために、複数のエッジ関係を持つi2iグラフを作成し、人気の偏差を排除するためにエッジ作成プロセスに人気ペナルティを導入しました。以下の図5に示すように、i2iグラフの作成とマルチホップウォークi2i候補サンプルの生成は、i2iグラフの作成、i2iマルチホップウォーク、およびi2i候補サンプルの生成の3つのステップに分けられます。

図5マルチホップウォーキングに基づくi2i候補サンプルの生成

最初のステップはi2iグラフの作成です。グラフには1種類のノード、つまり商品ノードがあり、2種類のエッジ関係はクリック共起エッジとマルチモーダルベクトルエッジです。クリック共起側は、ユーザーの過去の商品クリックシーケンスで構成され、サイドの重みは次の式で求められます。2つの商品間のユーザーの過去のクリック共起頻度に基づいて、各クリックの時間間隔共起は要因と見なされ、ユーザーアクティビティのペナルティと製品の人気のペナルティが追加されます。時間間隔係数は、2つの製品間の同時発生時間が短いほど、2つの製品間の類似性が高くなることを考慮に入れています。ユーザーアクティビティペナルティは、アクティブユーザーと非アクティブユーザーの公平性を考慮し、次の数で測定されます。ユーザーの過去の商品クリックはアクティブユーザーにペナルティーを科します。商品人気ペナルティは、商品の過去のクリック頻度を考慮し、人気商品にペナルティーを科し、人気の逸脱を緩和します[8]。

マルチモーダルベクトルエッジは、2つの製品間のテキストベクトルと画像ベクトルのコサイン類似度によって構築されます。K最近傍法は、製品のベクトルに使用され、K最近傍を見つけます。この製品とその最も近い隣接K積はそれぞれKエッジで構成され、ベクトル間の類似性はエッジの重みです。マルチモーダルベクトルエッジは人気とは関係がないため、人気の偏差を軽減できます。

2番目のステップは、マルチホップウォークを通じて複数のi2i関係を探索することです。1ホップi2i関係のさまざまな組み合わせを列挙して、さまざまなタイプの2ホップi2i関係を形成し、2ホップi2iを構築した後に元の1ホップを削除します。関係。冗長性を回避するためのi2i関係。i2iの関係には、クリックワンホップネイバーに基づくi2iの構築、ベクトルワンホップネイバーに基づくi2iの構築、クリッククリックツーホップウォークに基づくi2iの構築、クリックベクトル2ホップウォークに基づくi2i、およびベクトルクリック2ホップウォークi2iに基づく構築、1ホップi2i関係スコアは、1ホップエッジ重み、およびマルチホップi2iから導出されます。関係スコアは、次の式から導き出されます。つまり、各パスのエッジの重みを乗算してパススコアを取得し、すべてのパスのスコアを平均します。さまざまなエッジタイプのマルチホップウォークモードを通じて、より多くの製品が他の製品とのマルチホップ関係を構築する機会が増え、それによって製品候補セットが拡張され、選択バイアスが軽減されます。

3番目のステップは、各i2i関係に基づくi2iスコアに従って、すべての製品の候補製品セットをソートおよび切り捨てることです。各i2i関係間の類似性ヒートマップを以下の図6に示します。類似性は2つのi2i関係によるものです。構築された候補セットの繰り返し度の計算では、異なるi2i関係間の類似性に基づいて候補製品セットの数を決定し、後続のi2iモデリングのために各i2i関係の各製品のi2i候補セットを取得できます。

図6i2i関係の類似性ヒートマップ

人気偏差最適化に基づくI2iモデリング

u2i2iモデリング変換を使用して、従来のu2iベースのCTR推定モデリング手法をマルチホップi2i関係を簡単に使用できるi2iモデリング手法に変換し、人気ペナルティ付きの損失関数を導入して、i2iモデルを学習させます。人気の偏りを緩和する方向。

下の図7に示すように、ユーザーのクリック前の動作シーケンスを分割し、クリックされた各製品をソースアイテムとして使用し、i2iグラフのマルチホップウォーク候補セットからターゲットアイテムを抽出して、i2iサンプルセットを形成します。 。対象商品セットについては、次回ユーザーがクリックした商品が対象商品と一致しているかどうかに応じて、サンプルのラベルをご紹介します。このように、ユーザー選択に基づくシーケンスモデリング[9]をi2iベースのモデリングに変更し、2つの製品クリックの時間差とクリック間隔を通じてユーザーのシーケンス情報を側面から紹介し、i2iの学習を強調します。選択性バイアスを排除する目的を達成するために。エンドユーザーの推奨製品ランキングリストは、ユーザーのi2iスコアに基づいて、ターゲットアイテムを並べ替えることができます。

図7i2iトレーニングサンプルの生成

図8に示すように、自動化された機能エンジニアリングのアイデアを使用して、高レベルの機能の組み合わせを調査し、バイアスの問題からビジネスの意味を抽象化する問題を軽減します。頻度特徴、グラフ特徴、行動特徴、時間関連特徴などのいくつかの基本特徴を人為的に構築した後、これらの基本特徴タイプをカテゴリ特徴、数値特徴、時間特徴の3つのタイプに分類し、高レベルの特徴をベースにします。これらの機能について。機能の組み合わせ。各組み合わせによって形成された機能は、高次の組み合わせの複雑さを軽減するために、組み合わせの次の反復に追加されます。また、機能の重要性とNDCG @ 50_halfに基づいて、高速な機能選択を実行します。これにより、より深いモードを掘り下げ、多くの人件費を節約できます。

図8自動化機能エンジニアリング

モデルに関しては、LightGBM、Wide&Deep、タイミングモデルなどを試しましたが、LightGBMの表形式での優れたパフォーマンスにより、最終的にLightGBMを選択しました。

モデルトレーニングでは、商品人気の加重損失を使用して人気偏差を排除し[10]、損失関数Lは次の式で示されます。

その中で、パラメータαは人気に反比例し、人気商品の重みを弱め、人気の偏差を排除します。パラメータβは、サンプルの不均衡の問題を解決するために使用される正のサンプルの重みです。

ユーザーの好みのランキング

最後に、ユーザーの商品嗜好ランキングは、ユーザーが商品をクリックした履歴からi2iを紹介し、i2iによって紹介されたすべての商品の最終的なランキング問題を形成することです。ソートプロセスでは、図7に示すように、ターゲットアイテムセットは各ソースアイテムによって個別に生成されるため、異なるソースアイテムと異なるマルチホップワンダリングi2i関係が同じターゲットアイテムを生成する可能性があります。同じユーザーの同じターゲットアイテムのモデルスコアを集計する方法を検討する必要があります。確率の合計を直接実行すると、人気の偏差が強化されますが、平均値を直接取得すると、いくつかの強い信号が簡単に無視されます。最後に、ユーザーの複数の同一のターゲットアイテムに対して最大プーリング方法を使用してから、すべてのユーザーのターゲットアイテムを並べ替えます。これにより、NDCG @ 50_halfに良い効果をもたらすことができます。

NDCG @ 50_half指標をさらに最適化するために、得られたターゲットアイテムのスコアを後処理し、人気の低い製品のスコアの重みを増やすことで人気の高い製品をさらに抑制し、最終的にNDCG @でより良いスコアを達成しました。 50_half効果、これは実際にはNDCG @ 50_fullとNDCG @ 50_halfの間のトレードオフです。

評価結果

マルチホップワンダリングに基づいてi2i候補サンプルを生成するプロセスにおいて、さまざまなi2i関係のヒットレートを表2に示します。同じ長さ1000の複数のメソッドを混合すると、ヒットレートが向上することがわかります。より偏りのないデータシステムの選択性バイアスを軽減するために、トレーニングセットと候補セットを増やすために導入できます。

表2さまざまなi2i関係のヒット率

結局、美団検索連動型広告チームが結成したエイスターは、NDCGやヒット率を含むすべての評価指標で1位を獲得しました。表3に示すように、NDCG @ 50_halfは2位より6.0%高く、NDCG @ 50_full It NDCG @ 50_fullと比較して、NDCG @ 50_halfには明らかな利点があり、偏差を排除する問題をより適切に最適化したことを示しています。

表3さまざまな参加チームソリューションのNDCG評価結果

広告ビジネスアプリケーション

検索アルゴリズムチームは、MeituanとDianpingのデュアルプラットフォームでの検索広告とスクリーニングリスト広告ビジネスを担当しています。ビジネスタイプには、ケータリング、レジャーとエンターテインメント、美容、ホテルが含まれます。豊富なビジネスタイプは、アルゴリズムに大きなスペースと課題をもたらします。最適化。

検索連動型広告ビジネスの問題では、データバイアスの問題は重要で挑戦的な問題です。広告システムには、場所の偏差と選択的な偏差の2つの重要なデータ偏差があります。検索広告アルゴリズムチームは、これら2つの偏差に対してさらに最適化を行っています。位置偏差の問題、つまり、前の位置のクリック率は後の位置のクリック率よりも当然高くなります。偏差を処理す​​る従来の方法とは異なり、一貫性モデリングのアイデアを導入し、柔軟な方法で一貫性の目標を達成します深いネットワーク設計。改善された業績を達成します。

選択的逸脱の問題に関しては、図9に示すように、広告システムの配信プロセス全体で目標到達プロセスの図が表示されます。システムは、マッチング、クリエイティブ選択、ランキング、オークションの各段階に分かれています。各ステージの候補は、前のステージで選択されます。ランキング段階(ランキング)を例にとると、オンラインシステムのランキング候補には、マッチング(マッチング)段階で出力されたすべての候補が含まれますが、ランキングモデルのトレーニングデータは、モデルによって選択された露出(ページビュー)データに基づいています、これはオンラインランキングシステムのみです。候補の小さなサブセットの場合、モデルのオンライン入力データとオフライン入力データの違いは、モデル分布の一貫性の仮定に違反します。上記の選択性の偏差は、2つの明らかな問題を引き起こします。

  1. 不正確なモデル予測:曝露サンプルから学習されたモデルは偏っていて不正確であり、特に過去の曝露サンプルの分布に大きな違いがある候補サンプルの場合、オンライン予測効果が低くなります。

  2. フィードバックリンクループは広告エコロジーに影響を与えます。モデルによって選択されたサンプルが露出され、モデルトレーニングに参加して新しい露出サンプルをさらに選択するため、モデルはバイアスされたサンプルに基づいて学習を続け、全体的なフィードバックループは偏差の影響を受け、システムの選択が増えています。狭くなるほど、「マシュー効果」が形成されます。

図9広告システムの漏斗図

上記の推定と生態学的問題を解決するために、サンプル生成と多段階トレーニングを通じてアルゴリズムを最適化します。サンプル生成に関しては、データ生成とサンプル選択の3つの側面を実行します。まず、図10に示すように、ベータ分布に基づく探索アルゴリズムを使用して、過去のクリック率と統計的信頼度から探索候補を生成します。アルゴリズムの背後にある前提は、信頼度が高いほど、クリック率の変動が小さくなることです。

下図に示すように、横軸は推定クリック率、縦軸は確率密度を表しています。黄色のボックス内のパラメータのベータ分布によって生成されたサンプルの推定クリック率分布は次のとおりです。モデルの露出データによって選択されたもののみを補足するために使用される実際のサンプル分布に近い。次に、ランダムウォークを組み合わせてネガティブサンプルを最適化し、サンプリングアルゴリズムとラベル最適化を通じて精度を制御します。最後に、ほとんどのトレーニングサンプルはシステムのメインフローによって選択され、次のモデル最適化後に選択されるトレーニングサンプルは大幅に変化します。上記の違いにより、ABTestの小フローモデルの精度も期待に応えられなくなります。 。上記の違いにも対処します。モデルによって選択されたデータ分布の違いは、データの選択に使用されます。

図10さまざまなパラメーターのベータ分布

さらに、さまざまなサンプルの分布における上記の違いを組み合わせて、モデルは多段階トレーニングによって最適化されます。図11に示すように、サンプル強度に基づいてトレーニングシーケンスとパラメーターを制御し、トレーニングデータがライン上の実際の候補者の分布とより一致します。最終的に、CTR予測モデル(ランキング段階)とクリエイティブ選択モデル(クリエイティブ選択段階)の2つのモジュールがより重要なビジネス効果の改善を達成しただけでなく、より一貫性のあるモデリング方法により、候補の拡大やその他の逸脱がさらに重くなりました。問題の実験はネガティブからポジティブに変わり、より確実な検証方法も将来の最適化のための確固たる基盤を築きました。

図11サンプル強度に基づく多段階トレーニング

まとめと展望

KDDカップは、業界と非常に密接に関連しているコンテストです。毎年開催されるコンテストの質問は、業界のホットな問題と実際的な問題に密接に関連しています。長年にわたって作成された受賞ソリューションは、業界にも大きな影響を与えます。たとえば、KDDカップ2012の優勝プログラムでは、業界で広く使用されているFFM(Feild-aware Factorization Machine)とXGBoostのプロトタイプが作成されました。

今年のKDDカップのバイアス除去の問題は、現在の広告と推奨の分野で最も困難な問題の1つでもあります。この記事では、KDDカップ2020のバイアス除去で1位を獲得するためのソリューションを紹介します。 u2iモデリングをi2iモデリングに変換するu2i2iメソッド、およびマルチホップウォークを通じてより偏りのないサンプルを探索するための異種グラフを作成することにより、選択バイアスを軽減します。プロセスでは、グラフを作成するプロセス、モデルの損失関数、および推定値の後処理により、人気の偏りを軽減するために人気のペナルティが導入され、最終的に選択の偏りと人気の偏りという2つの課題が克服されました。

同時に、この記事では、美団検索広告におけるデータ選択的逸脱の問題に関するビジネスアプリケーションも紹介します。以前は、広告システムは逸脱の問題に最適化されていました。この競争は、逸脱の問題。さらなる理解。今後は、今回のコンペで得られた偏差最適化の経験をもとに、広告システムの偏差問題をさらに最適化し、広告システムをより公平なものにしていきたいと考えています。

参照

[1]レコメンダーシステムの公平性

[2] Singh A、JoachimsT。ランキングでの露出の公平性[C] //知識発見とデータマイニングに関する第24回ACMSIGKDD国際会議の議事録。2018:2219-2228

[3] Stinson C.アルゴリズムはニュートラルではありません:レコメンデーションシステムのバイアス[J]。2019年。

[4] Ovaisi Z、Ahsan R、Zhang Y、他。Learning-to-rankシステムの選択バイアスの修正[C] // Web Conference2020の議事録。2020:1863-1873。

[5] Wang X、Bendersky M、Metzler D、他。個人検索における選択バイアスでランク付けすることを学ぶ[C] //情報検索の研究開発に関する第39回国際ACMSIGIR会議の議事録。2016:115-124。

[6] Abdollahpouri H、Burke R、MobasherB。ランク付け学習の推奨における人気バイアスの制御[C] //レコメンダーシステムに関する第11回ACM会議の議事録。2017:42-46。

[7] Abdollahpouri H、Mansoury M、Burke R、他。推奨における公平性と調整に対する人気バイアスの影響[J]。arXiv preprint arXiv:1910.05755、2019。

[8] Schafer JB、Frankowski D、Herlocker J、他。協調フィルタリングレコメンダーシステム[M] //アダプティブウェブ。シュプリンガー、ベルリン、ハイデルベルク、2007年:291-324。

[9] Zhang S、Tay Y、Yao L、他。自己注意のある次のアイテムの推薦[J]。arXiv preprint arXiv:1808.06414、2018。

[10] Yao S、Huang B.パリティを超えて:協調フィルタリングの公平性の目標[C] //ニューラル情報処理システムの進歩。2017:2921-2930。

著者について

Strong、Mingjian、Hu Ke、Qu Tan、Lei Junなどはすべて、Meituan広告プラットフォームの検索広告アルゴリズムチームから来ています。

- - - - - 終わり - - - - -

求人

Meituan広告プラットフォームの検索広告アルゴリズムチームは、検索広告シーンに基づいており、ディープラーニング、強化学習、人工知能、ビッグデータ、ナレッジグラフ、NLP、コンピュータービジョンの最先端の技術開発を調査し、ローカルライフサービスのeコマースの価値。主な作業指示は次のとおりです。

トリガー戦略:ユーザーの意図の認識、広告ビジネスデータの理解、クエリの書き換え、ディープマッチング、相関モデリング。

品質の見積もり:広告品質のモデリング。推定クリック率、コンバージョン率、顧客単価、およびトランザクション量。

メカニズムデザイン:広告ランキングメカニズム、入札メカニズム、入札提案、トラフィック見積もり、予算配分。

クリエイティブの最適化:インテリジェントなクリエイティブデザイン。広告画像、テキスト、グループ注文、割引情報などの表示の創造性を最適化します。

仕事の要件:

  • 3年以上の関連する実務経験があり、CTR / CVR推定、NLP、画像理解、およびメカニズムデザインの少なくとも1つの側面でのアプリケーション経験があります。

  • 一般的に使用される機械学習、深層学習、強化学習モデルに精通している。

  • 優れた論理的思考能力、困難な問題を解決するための情熱、データに敏感、問題の分析/解決に優れています。

  • コンピュータおよび数学関連の専攻で修士号以上。

次の条件が推奨されます。

  • 広告/検索/推奨に関連するビジネス経験がある。

  • 大規模な機械学習の経験があります。

興味のある学生は、tech @ meituan.comに履歴書を提出できます(メールのタイトルを記入してください:Guangping SearchTeam)。

多分あなたはまだ見たいです

Meituan DianpingAlliance広告のシナリオベースのターゲットソートメカニズム

MeituanDianping広告のリアルタイムインデックスの設計と実装

Meituan Dianping PerformanceAdvertising実験的構成プラットフォームの設計と実装

おすすめ

転載: blog.csdn.net/MeituanTech/article/details/108138537