KDDカップ2020マルチモーダルリコールコンペティション3位プログラムと広告ビジネスアプリケーション

 

 

ACM SIGKDD(知識発見とデータマイニングに関するACM SIGKDD会議)は、データマイニングの分野で世界トップの国際会議です。今年、KDDカップは、データバイアス(バイアス除去)、マルチモダリティリコール(マルチモダリティリコール)、自動グラフ学習(AutoGraph)、敵対的学習問題、強化学習問題を含む、4つのトラックと合計5つの競争質問を設定しました。

米国のミッションアルゴリズム検索広告チームは、最終的にDebiasingがチャンピオンシップ(1/1895)トラックを獲得し、AutoGraphトラックもチャンピオンシップ(1/149)を獲得しました。Multimodalitiesリコールトラック、二次点はMeituan検索とNLPチーム(1433分の2)が優勝し、第二次点はMeituan検索広告アルゴリズムチーム(1433分の3)で優勝しました。

この記事では、トラック3位のマルチモーダルリコールの技術的ソリューションと、Meituan検索広告ビジネスでのそのアプリケーションと実践を紹介します。関連する仕事をしている学生に、何か助けやインスピレーションを与えたいと思っています。

バックグラウンド

独自のビジネスシナリオに基づいて、Meituan to-store広告プラットフォームの検索広告アルゴリズムチームは、最先端のテクノロジーを継続的に最適化および革新してきました。チームは、グラフ学習、データ偏差、およびマルチモーダルの3つのフロンティア領域に特定のアルゴリズムを持っています。学習。研究と応用、そして良い業績を達成しました。

チームは、これら3つの分野での技術の蓄積に基づいて、KDDカップ2020コンテストで、密接に関連する3つのコンテストの質問を選択しました。これらの分野での技術の蓄積を適用および改善し、技術とビジネスにさらなるブレークスルーをもたらすことを望んでいます。チームのHuangJianqiang、Hu Ke、Qi Yi、Qu Tan、Chen Mingjian、Zheng Bohang、Lei Jun、Tang Xingyuanは、中国科学大学の共同で参加チームAisterを結成し、AutoGraph、Debiasing、MultimodalitiesRecallに参加しました。 3つの質問、そして最終的にAutoGraphトラック(1/149)でチャンピオンシップを獲得しました(KDDカップ2020自動地図学習コンペティションチャンピオンの技術計画と美団広告の実践)、Debiasingトラック(1/1895)でチャンピオンシップを獲得しました(KDDカップ2020 Meituan Practiceでの競争チャンピオンシップの技術計画と広告のバイアスを取り除き、Multimodalities Recallトラック(3/1433)で3位を獲得しました。

図1KDD2020会議

 

自然と生活の中で複数のモダリティの絡み合った補完的な情報を扱うには、マルチモーダル学習が唯一の方法です。インターネットインタラクションの継続的な進化に伴い、マルチモーダルコンテンツはグラフィック、テキスト、ビデオなどでより豊富になりました。同じ傾向がMeituanの検索広告システムにも反映されています。

検索連動型広告アルゴリズムチームは、マルチモーダル学習関連テクノロジーを使用し、ビジネスで良好な結果を達成し、今年のKDDカップのマルチモダリティリコールトラックで3位を獲得しました。この記事では、マルチモダイライトリコールコンペティションの技術的ソリューションと、広告ビジネスにおけるマルチモーダル学習関連技術のチームの応用と研究を紹介します。関連研究に従事する学生にとって、それが役立つか、刺激になることを願っています。

図2KDDカップ2020マルチモダリティリコール競争トップ10リスト

 

競争の質問の紹介と分析

トピックの概要

マルチモーダルリコールコンテストは、アリババダルマアカデミーのインテリジェントコンピューティング研究所によって開始および開催され、eコマース業界におけるマルチモーダル情報学習の問題に焦点を当てています。2019年、世界のオンラインeコマース収益は3,530億米ドルに達しました。関連する予測によると、2022年までに総収入は6,540億米ドルに増加します。大規模な収益と急速な成長は、消費者が電子商取引サービスに大きな需要を持っていることを意味します。この成長に続いて、電子商取引業界では、ライブブロードキャスト、ブログなど、さまざまな情報モダリティがますます豊富になっています。これらのマルチモーダル情報を従来の検索エンジンやレコメンデーションシステムに導入して、消費者により良いサービスを提供する方法は、関連する実務家による詳細な議論に値します。

このトラックは、タオバオモールの実際のデータを提供します。1つは元のデータである検索文(クエリ)に関連し、もう1つは知的財産権などを考慮した製品写真に関連します。画像に高速RCNNを使用することです抽出された特徴ベクトル。データの2つの部分は、クエリベースの画像想起問題、つまり、テキストモーダルと画像モーダルの想起問題として編成されています。

理解を容易にするために、このトラックは少量の実際の画像とそれに対応する生データを提供します。以下は例です。伝説は前向きな例です。クエリは甘いフレンチドレスです。写真の主要部分は甘いドレスを着た女性です。主要部分の外には、ハンドバッグ、いくつかの風船、いくつかなど、厄介な情報がたくさんあります。商標。プロモーションテキスト情報。質問自体は元の画像を提供しませんが、Faster RCNNによって画像から抽出された特徴ベクトル、つまり画像のフレーム部分を提供します。Faster RCNNは、画像内の明らかなセマンティックコンテンツを抽出することがわかります。これは、モデルの学習に役立ちます。一方、Faster RCNNの抽出には、セマンティクスの優先順位を反映しないボックスが多く含まれています。 。これらのボックスを使用してテキストを一致させる方法は、質問の中心的な内容です。

このコンテストに設定された評価指標はNDCG @ 5です。具体的には、特定のテストセットで、各クエリは約30個のサンプルを提供し、そのうち約6個が陽性サンプルで、残りが陰性サンプルです。コンテストでは、競技者がマッチングアルゴリズムを設計し、5つの陽性サンプルをリコールしてクエリのすべてのスコアを取得する必要があります。それ以外の場合、NDCGインデックスは、リコールされた陽性サンプルの数に応じてクエリのスコアとして計算されます。すべてのクエリスコアが平均化され、最終スコアが取得されます。

図3クエリと製品データの例

 

データ分析と理解

このトラックは、トレーニングセット、検証セット、テストセットと呼ばれる3つのデータセットを提供します。各データセットの基本情報は次のとおりです。

表1データセットの概要

 

データの特性をさらに調査するために、検証セットで提供された元の画像と特徴情報を集約しました。次の表は一連の例です。

表2検索フレーズと画像の一致の正と負の例

上記の調査に基づいて、データセットの3つの重要な特性を要約しました。

  • トレーニングセットと検証セット/テストセットのデータ特性はまったく異なります。トレーニングセットの規模は、検証セット/テストセットの規模よりも大幅に高く、300万のクエリとイメージのペアがあります。これは、検証セット/テストセットの100倍以上です。同時に、トレーニングセット内の各クエリと画像のペアはポジティブサンプルと見なされます。これは、複数のポジティブ画像とネガティブ画像を含む検証セットで指定されたクエリとは完全に異なります。元の画像の視覚的な調査と検証セットのクエリを通じて、検証セットのデータは高品質であり、手動でラベル付けする必要があることがわかります。手動ラベリングのコストとネガティブサンプルの欠如を考慮すると、トレーニングセットは、手動ラベリングのセマンティックマッチング関係ではなく、クリック関係を説明する可能性があります。私たちのソリューションは、トレーニングセットの分布とテストセットの分布が一致しないという基本的な特性を考慮に入れる必要があります。

  • 画像情報は複雑で、多くの場合、複数のオブジェクトが含まれています。これらのオブジェクトはすべて指定された機能としてフレーム化されていますが、フレーム間のセマンティック情報は等しくありません。クエリ(男性用ハイカラーセーター)のサングラス、スカーフ、カメラのブロック図などのノイズであるものもあれば、繰り返されるものもあります。クエリの下で繰り返される靴のブロック図(通気性があり快適な子供用靴)など、製品の表示ニーズに対応します。平均して、画像には4つのフレームがあります。これらの複数のフレームに含まれる意味情報をノイズ除去および合成して、画像の全体的な意味表現を取得する方法は、モデリングの焦点です。

  • 与えられた元のテキストとして、クエリは一般的に使用されるコーパスとは完全に異なる構造と分布を持っています。サンプルテーブルから、クエリは自然な文ではなく、いくつかの属性と商品エンティティを連結して形成されたフレーズであることがわかります。統計によると、クエリの90%は3〜4語で構成され、トレーニングセットには約150万の異なるクエリがあり、語彙サイズは約15000です。最後の単語まで、すべてのクエリを約2000のカテゴリに減らすことができます。各カテゴリは特定の商品名詞です。これらのテキストデータの特性を考慮し、的を絞った処理を行う必要があります。

問題の挑戦

この競争は、eコマースの検索データに関するマルチモーダル情報マッチングタスクです。上記のデータセットの3つの特性から始めて、競争の2つの主要な課題を要約しました。

まず、一貫性のない配布の問題。従来の統計的機械学習の基本的な前提は、トレーニングセットとテストセットの分布が同じであるということです。分布に一貫性がないと、通常、モデルの学習バイアスが発生し、トレーニングセットと検証セットの効果を調整することは困難です。既存の大規模トレーニングセットとテストセットと同じ分布の小規模検証セットのクリック信号に依存し、実行可能なデータ構築方法とモデルトレーニング手順を設計し、伝達学習などの手法を採用して対処する必要があります。この問題で。

第二に、複雑なマルチモード情報マッチングの問題。マルチモーダル情報融合を実行する方法はマルチモーダル学習の基本的な問題であり、複雑なマルチモーダル情報に対してセマンティックマッチングを実行する方法はこの競争のユニークな課題です。データの観点から、製品画像には複数のフレーム、大きな情報コンテンツ、およびより多くのノイズが含まれます。一方、ユーザー検索クエリには通常、複数のきめ細かい属性単語が含まれ、各単語はセマンティックマッチング。これには、モデルの設計におけるグラフとクエリの複雑さに対処し、きめ細かい一致を行う必要があります。

これら2つの課題に対応して、検索広告チームのソリューションについて以下に詳しく説明します。

競争計画

私たちのソリューションは、上記の2つの課題に直接対応します。その主要部分には2つの側面があります。1つは、一貫性のない分布の問題に対処するために、共同の多様なネガティブサンプリング戦略と蒸留学習を通じてトレーニングデータとテストセットの分布を橋渡しすることです。グレインテキスト画像マッチングネットワークは、マルチモーダル情報融合を実行し、複雑なマルチモーダル情報マッチング問題を処理するために採用されています。最後に、2段階のトレーニングとマルチモードフュージョンにより、モデルのパフォーマンスをさらに向上させました。プログラム全体のフローを次の図に示します。計画のさまざまな部分の詳細を以下に示します。

図4多様なネガティブサンプリングに基づく多段階蒸留学習フレームワーク

 

さまざまなネガティブサンプリング戦略と事前トレーニング

トレーニングセットとテストセットの配布に一貫性がありません。最も直感的な矛盾は、トレーニングセットに正のサンプルのみがあり、負のサンプルがないことです。負のサンプルを作成するための負のサンプリング戦略を設計し、サンプリングされた負のサンプルをテストセットの実際の分布にできるだけ近づける必要があります。最も直感的なアイデアは、ランダムにサンプリングすることです。ランダムサンプリングはシンプルで実装が簡単ですが、検証セットとはかなり異なります。

ただし、検証セットを分析すると、同じクエリの下の候補画像には通常、密接な意味的関連があることがわかりました。たとえば、「Sweet French dress」というクエリでは、選択する写真はすべてドレスですが、スタイルが異なります。これは、このマルチモーダルマッチングの質問が、より細かい属性の粒度でテキストと画像をマッチングする必要があることを示しています。画像タグとクエリワードの2つの観点から、対応するクラスタリングアルゴリズムを使用して、サンプリングするスペースをグローバルから同様のセマンティックアイテムに絞り込み、テストセットの分布に近いネガティブサンプリングの目的を達成できます。 。

上記の分析に基づいて、サンプルセットを構築するために次の表に示す4つのサンプリング戦略を設計しました。4つの戦略の中で、ランダムサンプリングによって取得された正と負のサンプルが最も区別しやすく、クエリの最後の単語に従ってサンプリングによって取得された正と負のサンプルが最も区別が困難です。トレーニングでは、ベンチマークモデルと最も単純なランダムから開始ベンチマークモデルはサンプリングでトレーニングされ、次に画像ラベルによってサンプリングされ、前のモデルに基づいてクエリによってクラスター化されたより難しいサンプルセットでトレーニングが続行され、最後に最も難しいサンプルセットでトレーニングされます。クエリの最後の単語によってサンプリングされます。簡単なものから難しいものまで、そして遠くから近くまでトレーニングするこの方法は、モデルが検証セットの分布に収束するのに役立ち、テストセットでより良い結果を達成します。

表3多様なネガティブサンプリング

 

蒸留学習

さまざまなサンプリング戦略を使用して、さまざまな角度からテストセットの真の分布を概算できますが、テストセット情報がネガティブサンプリングのガイドに直接使用されないため、これらのサンプリング戦略は依然として不十分です。したがって、蒸留学習を使用して、サンプルセットの分布をテストセットに近づけるために、ネガティブサンプリングロジックをさらに最適化します。

次の図に示すように、トレーニングセットのネガティブサンプリングによって取得されたサンプルセットで事前トレーニングを行った後(ステップ1)、検証セットでモデルをさらに微調整して、微調整されたモデルを取得します(ステップ2)。微調整モデルを使用して、代わりにトレーニングセットの疑似ラベルをソフトラベルとして使用し、ソフトラベルを損失に導入し、元の0-1ハードラベルと共同で学習しました(ステップ3)。このように、トレーニングセットのトレーニングは、検証セットの分布に近い検証セットの分布情報を直接導入し、事前トレーニングモデルのパフォーマンスを向上させます。

図5多段階蒸留学習

 

きめ細かいマッチングネットワーク

マルチモーダル学習が優勢であり、さまざまなタスクやモデルが次々と出現しています。私たちが直面している複雑な画像と検索クエリのマッチングの問題に対応するため、CVPR 2017のVQAコンテストのチャンピオンシップスキームを参照して、次のニューラルネットワークモデルをメインモデルとして設計しました。

モデルの設計では、主に次の3つの点を考慮しました。

  • セマンティックマッピングには、ゲートを備えた完全に接続されたネットワークを使用します。画像とクエリは異なるセマンティックレベルにあり、同じセマンティック空間にマップするために関数を使用する必要があります。この目標を達成するために、2つの完全に接続されたレイヤーを採用しました。実験により、完全に接続された層の隠れ層のサイズがより敏感なパラメーターであることがわかりました。隠れ層を適切に増やすと、計算の複雑さを過度に増やすことなく、モデルの効果を大幅に向上させることができます。さらに、文献に記載されているように、ゲートを備えた完全に接続された層を使用すると、セマンティックマッピングネットワークの効果をさらに高めることができます。

  • 双方向の注意メカニズムを採用します。画像とクエリはどちらも、よりきめ細かいサブセマンティックユニットで構成されています。具体的には、画像上に複数のフレームがあり、各フレームには独立した意味情報があります。クエリは複数の単語に分割され、各単語にも独立した意味情報が含まれます。このデータの特性は、eコマース検索シナリオによって決定されます。したがって、モデルを設計するときは、個々のサブセマンティックユニット間のマッチングを考慮する必要があります。これらのサブユニットの一致関係と重要性をキャプチャするために、単一の単語とすべてのボックス、単一のボックスとすべての単語の双方向の注意メカニズムを使用します。

  • 多様なマルチモードフュージョン戦略を使用します。マルチモーダル情報融合には多くの方法があり、そのほとんどは最終的に画像ベクトルとクエリベクトルの間の数学演算子に要約されます。異なる融合方法には独自の特性があることを考慮して、複数の融合は一致関係をより包括的に記述することができます。クロネッカー積の3つの融合方法、ベクトル連結と自己注意を採用し、意味空間変換と注意メカニズムマッピングの後に画像ベクトルを組み合わせました。クエリベクトルは情報の融合に使用され、最終的に完全に接続されたニューラルネットワークに送信されて、一致するかどうかの確率値が取得されます。

さらに、BERTモデルなどの一般的な事前トレーニングモデルを使用する代わりに、トレーニングセットサンプルで事前トレーニング単語ベクトルを使用して、元のクエリ表現を取得します。ここでの主な考慮事項は、クエリが一般的な自然文とは非常に異なり、特定の属性/カテゴリ名詞と組み合わされたフレーズのセットに似ていることをデータ分析が指摘していることです。これは、次のような事前トレーニングモデルで使用されるコーパスとは明らかに異なります。 BERTとして。実際、Gloveの事前トレーニング単語ベクトルなどを導入する最初の試みは、クエリテキストで直接事前トレーニングする場合と比較して明らかな利点はありません。BERTモデルは比較的扱いにくく、迅速な反復を促進しないことを考慮して、最終的に関連する言語モデルテクノロジを使用しませんでした。

図6きめ細かいマッチングネットワーク

 

マルチモードフュージョン

上記の技術的手段を用いて、複数の基本モデルを取得しました。これらのモデルは、検証セットで微調整できるため、その効果は実際の分布に近くなります。一方では、Finetuneステージは、前述のニューラルネットワークマッチングモデルを引き続き使用できます。一方、前述のニューラルネットワークは、特徴抽出器として使用して、その出力を小規模な検証セットに配置し、再トレーニングのためにツリーモデルに組み込むことができます。この利点は、ツリーモデルとニューラルネットワークモデルが異種であり、融合効果が優れていることです。最終的に、私たちが提出した結果は、複数のニューラルネットワークモデルとツリーモデルの融合の結果です。

評価結果

ベンチマークモデルとして、ランダムサンプリングによってトレーニングされた粗粒度(画像はすべてのボックスの平均として表され、クエリはすべての単語の平均として表されます)マッチングネットワークを使用します。次の表に、ベンチマークモデルに対するソリューションの各部分の改善効果を示します。

表4さまざまな方法のNDCGの改善

 

広告ビジネスアプリケーション

検索広告アルゴリズムチームは、MeituanとDianpingのデュアルプラットフォームの検索広告とスクリーニングリスト広告ビジネスを担当しています。ビジネスタイプには、ケータリング、レジャーとエンターテインメント、美容、ホテルが含まれます。豊富なビジネスタイプは、アルゴリズムに大きなスペースと課題をもたらします。最適化。検索連動型広告のクリエイティブ最適化段階では、現在の検索用語やスクリーニング意図を通じて、各ユーザーの広告表示結果に高品質の画像を選択することを目的としています。ユーザーの検索用語と画像は、次元と表現の粒度が大きく異なります。マルチモーダル学習を使用してこの問題を解決し、同じ空間にクロスモーダル表現をマッピングします。

下図に示すように、マルチモーダルネットワークでは、広告機能、リクエスト機能、ユーザー設定、画像機能が入力として使用されます。画像機能は、CNNネットワークから抽出された画像ベクトルによって表され、他の機能が交差します。密なベクトル表現を取得するための多層MLPによって、そして最後に、画像損失とマルチモード損失の損失関数を介してモデルトレーニングを制約します。このモデリング手法により、クリエイティブ最適化モデルは、クエリに応じてさまざまなユーザーの広告結果に最適な画像を提示できます。

図7広告クリエイティブビジネスにおけるマルチモーダル学習

 

検索広告システムは、広告のトリガー、クリエイティブの最適化、クリック率の推定(広告の粒度)などのモジュールに分かれています。その中で、クリエイティブ最適化段階では、広告結果ごとに10を超える画像候補があり、オンラインサービスの計算は、クリック率の見積もり(広告の粒度)の10倍を超えており、パフォーマンスに対する要件が高くなっています。時間を短縮し、モデルの複雑さを軽減するためには、必然的にモデルの精度が低下します。

モデルのパフォーマンスと効果のバランスをとるために、この問題に対処するための知識蒸留のアイデアを借用し、表現力の高い広告粒度予測モデルを借用しました。上の図7に示すように、左側のモデルは、教師ネットワークとして使用できる複雑な広告粒度のクリック率推定モデルです。右側は、学生ネットワークである単純なクリエイティブ粒度最適化モデルです。学生ネットワークの客観的損失関数では、学生ネットワーク自体の出力ロジットの対数損失に加えて、そのロジットと教師のネットワーク出力ロジットの間の二乗誤差も追加されます。この補助的な損失により、生徒モデルの出力を教師モデルの出力に近づけることができます。したがって、学生モデルは、比較的単純なネットワークスケールを維持しながら精度を向上させるという目標を達成するために、教師モデルに近づくことを学ぶことができます。

さらに、最下層は埋め込みの設計を共有しているため、学生モデルの最下層パラメーターを教師モデルでトレーニングできます。さらに、精度を向上させると同時に、複数のモジュール間の一貫性(CTR推定やクリエイティブの最適化など)もシステムの精度を向上させるための鍵となります。ターゲットと表現の学習に関する教師と生徒の共同トレーニングは、多段階のターゲットの統合に役立ちます。精度の向上と多段階の目標の一貫性に基づいて、オンラインビジネスの結果を大幅に改善しました。

図8広告クリエイティブビジネスにおける蒸留学習

 

まとめと展望

KDDカップは、業界と非常に密接に関連しているコンテストです。毎年開催されるコンテストの質問は、業界のホットな問題と実際的な問題に密接に関連しています。長年にわたって作成された受賞ソリューションは、業界に大きな影響を与えます。たとえば、KDDカップ2012は、業界で広く使用されているFFM(Feild-Aware Factorization Machine)およびXGBoostプロトタイプを作成しました。

今年のKDDカップは、主に自動化されたグラフ表現学習とレコメンデーションシステムの分野に焦点を当てています。自然界の情報は多くの場合、複数のモダリティと混合されており、マルチモーダル情報の処理と処理は、近年の主要な研究のホットスポットです。同時に、業界の検索エンジンやレコメンデーションシステムに関連するマルチモーダル情報処理がますます重要になっています。特にライブ放送やショートビデオなどのビジネス形態の台頭により、マルチモーダル学習が不可欠になっています。

この記事では、主にKDD CUP2020のマルチモーダル競争とMeituan検索広告アルゴリズムチームのソリューションを紹介します。データを十分に調査した後、競争データの3つの特性を分析すると同時に、競争の質問を2つの主要な課題、つまり、トレーニングセットとテストセットの一貫性のない分布、および複雑なマルチのマッチングに配置しました。モーダル情報。多様なネガティブサンプリング戦略、蒸留学習、事前トレーニング、微調整を通じて分布の不整合の問題に対処し、複雑なマルチモーダル情報マッチングの問題に対処するためにきめ細かいマッチングネットワークを使用しました。両方のアイデアが達成されました。大幅な改善。

同時に、クリエイティブ最適化モデルにおける写真とユーザーの好みの共同学習、クリエイティブモデルにおける蒸留学習の応用など、検索広告ビジネスにおけるマルチモーダル学習関連技術の実際の応用についても紹介します。競争の高強度で高速な反復を通じて、チームはマルチモーダル学習をより深く理解しています。今後の作業では、この競争で得られた経験に基づいて、よりマルチモーダルなビジネスシナリオを分析およびモデル化し、データの価値を発揮します。

参照

[1] Teney、Damien、他。「視覚的な質問応答のヒントとコツ:2017年の課題からの学習」コンピュータビジョンとパターン認識に関するIEEE会議の議事録。2018年。

[2]ヒントン、ジェフリー、オリオールヴィニャルス、ジェフディーン。「ニューラルネットワークで知識を抽出する。」arXiv preprint arXiv:1503.02531(2015)。

[3]ペニントン、ジェフリー、リチャードソーチャー、クリストファーD.マニング。「グローブ:単語表現のためのグローバルベクトル。」自然言語処理(EMNLP)の経験的方法に関する2014年の会議の議事録。2014年。

[4] Devlin、Jacob、他。「バート:言語理解のための深い双方向トランスフォーマーの事前トレーニング。」arXiv preprint arXiv:1810.04805(2018)。

[5] Zhou、Bolei、etal。「視覚的な質問応答のための単純なベースライン。」arXiv preprint arXiv:1512.02167(2015)。

[6] Yu、Zhou、etal。「視覚的な質問応答のための深いモジュラー共同注意ネットワーク。」コンピュータビジョンとパターン認識に関するIEEE会議の議事録。2019年。

著者について

Qi Yi、Jianqiang、Hu Ke、Lei Junなどはすべて、Meituan広告プラットフォームの検索広告アルゴリズムチームのメンバーです。

MeituanAIについて

Meituan AIは、「人々がよりよく食べ、より良く生きるのを助ける」ことを中核的な目標とし、実際のビジネスシナリオで最先端の人工知能技術を探求し、それを実際のサービスシナリオに迅速に実装して、経済のオフラインデジタル化を完了することに取り組んでいます。

Meituan AIは、Meituanの豊富なライフサービスシーンの要件から生まれ、シーン駆動型テクノロジーの独自性と利点を備えています。ビジネスシナリオと豊富なデータに基づいて、画像認識、音声インタラクション、自然言語処理、配信スケジューリングテクノロジーを通じて、無人配信、無人マイクロウェアハウス、スマートストアなど、人々の生活のあらゆる側面をカバーする実際のシナリオで使用できます。 、テクノロジーの使用ユーザーの生活の質の向上、業界のインテリジェンスのアップグレード、さらには社会全体のライフサービスのための新しいインフラストラクチャの構築を支援します。

詳細については、https//ai.meituan.com/をご覧ください。 

- - - - - 終わり - - - - -

求人

Meituan広告プラットフォームの検索広告アルゴリズムチームは、検索広告シーンに基づいており、ディープラーニング、強化学習、人工知能、ビッグデータ、ナレッジグラフ、NLP、コンピュータービジョンの最先端の技術開発を調査し、ローカルライフサービスのeコマースの価値。主な作業指示は次のとおりです。

トリガー戦略:ユーザーの意図の認識、広告ビジネスデータの理解、クエリの書き換え、ディープマッチング、相関モデリング。

品質の見積もり:広告品質のモデリング。推定クリック率、コンバージョン率、顧客単価、およびトランザクション量。

メカニズムデザイン:広告ランキングメカニズム、入札メカニズム、入札提案、トラフィック見積もり、予算配分。

クリエイティブの最適化:インテリジェントなクリエイティブデザイン。広告画像、テキスト、グループ注文、割引情報などの表示の創造性を最適化します。

仕事の要件:

  • 3年以上の関連する実務経験があり、CTR / CVR推定、NLP、画像理解、およびメカニズムデザインの少なくとも1つの側面でのアプリケーション経験があります。

  • 一般的に使用される機械学習、深層学習、強化学習モデルに精通している。

  • 優れた論理的思考能力、困難な問題を解決するための情熱、データに敏感、問題の分析/解決に優れています。

  • コンピュータおよび数学関連の専攻で修士号以上。

次の条件が推奨されます。

  • 広告/検索/推奨に関連するビジネス経験がある。

  • 大規模な機械学習の経験があります。

興味のある学生は、tech @ meituan.comに履歴書を提出できます(メールのタイトルを記入してください:Guangping SearchTeam)。

多分あなたはまだ見たいです

KDDカップ2020美団広告における競争チャンピオンの技術的解決策と実践の偏見

|  KDDカップ2020自動地図学習コンペティションチャンピオンの技術計画と美団広告の実践

| テキスト検索タスクにおけるMT-BERTの実践

おすすめ

転載: blog.csdn.net/MeituanTech/article/details/108786673