ターゲット広告と検索広告事業二つの異なる電気指していること:
明確な意図を持つ1.ユーザー(アクティブクエリクエリ)
淘宝網へのユーザーの前に2、および(従来の歴史的な行動が推奨するこの時点項目で)具体的な目標を持っていません
したがって、関連する追加のサンプルの特性や歴史を考慮した広告をターゲットに。
サンプルを分割する方法:
次のように正のサンプル:
P(Y = 1 |広告、コンテキスト、ユーザー)
ここで、広告主AD候補セットの代わりに、ユーザは、ユーザ特性、年齢、性別を表し、コンテキストは、機器、時間をコンテキストシーンを示しています。
淘宝網の広告は、指向進化:
第一段階:
LR(線形モデル) - "MLR(非線形モデル) - " DNNモデル(ディープラーニング)
LR時代理由は、LRの制限により、非線形特性は、(例えば時間など)を扱うことができない、非線形特性を投影するために必要であることを特徴とする請求加え、そうMKR(混合ロジスティック回帰)、分割統治戦略、区分的線形カスケード+の使用があるれています手動に比べ、高次元空間の分類非線形表面を適合することは、効率と精度を向上することです。
DNNの段階では、複雑なモデルと大量のデータが、固定長の埋め込みの使用を扱うことができ、ユーザの関心の多様な表現できません。
ベースモデルには、伝統的なDNNモデルを処理し、以下のとおりです。
埋め込み+ MLP
ここでは表し:ユーザープロファイル、ユーザーの行動、広告コンテキストとを
- 対応する異なる特徴に変換STEP1は、埋め込み表さ
- ステップ2、すべての機能の埋め込みは、ステッチありません
- STEP3、MLP(DNN)多層パーセプトロンへの入力、演算結果
- 各カテゴリには、機能分野の複数を含み
- 機能フィールドは、単一の特徴量である=>ワンホットエンコーディング
- 機能フィールドに特徴多値=>マルチホットエンコーディングであります
- レイヤ埋め込み、高次元の疎ベクトル密な低次元ベクトルに変換します
- 入力として異なるプーリングレイヤ+、連結層の使用プーリングアドレスユーザーの行動の問題の各寸法、および結果を埋め込む他の三つのカテゴリにスプライシングされ、MLPレイヤ
- スプライシング埋め込みを研究するMLPレイヤ、自動学習機能間のより高次の組み合わせ
- 負の対数尤度の損失を使って損失、損失関数
- Sは、訓練サンプルの数を表し、xは入力ネットワークであり、yは、{0、1}サンプルの標識であります
- P(x)は、推定クリック確率xの入力を表し、
行動のユーザ履歴を使用するには、我々はいくつかの要因を考慮する必要があります。
1.多様性、利用者は、そのような衣服、食品、家具、上のように、時間をかけて興味のあるカテゴリの様々な詰め込むことができます。この手段は、私はすべての埋込みのまとめをお勧めすることはできませんことを。
ユーザーが服をクリックした場合2.ローカル活性化は、この時点では、この予測のの埋込みの私の食べ物や家具は助けにはなりませんでした。
ビューの時系列の観点から3.、コモディティ目的の配列ではなく、法律は、それが服についてもう少し時間を懸念し、一部のユーザーは、次回ユーザーが、食品、食品を購入したいと考慮した場合、より少しを検索することが可能であり、そして巨大な存在でありますノイズが、そのような衣服として特に興味深いの具体的な、しかし、我々は、そのような服のスタイルの変革を購入するよう、時間をかけてトレンドの進化を見ることができます。
そのような私が服を拾う今回のように、これらのカテゴリ間の4ではなく、完全に興味を持って接触し、ユーザーはより多くの対話セッションとして機能している場合などに乗るだけでなく、リングの選択、アクセサリーを着用する必要があるかもしれません間にいくつかのリンクがあります。
DNNは1,2の問題があり、これらの問題を解決するために、アリは、ネットワークDINへの関心の深さを使用しました。
ディープ利息ネットワークのためのクリックスルー率予測、2018
https://arxiv.org/abs/1706.06978
- DINはDNN追加アテンションメカニズムに基づいています。
- 埋め込みコンピューティングユーザーの行動を導入注意ネットワーク上で(また、活性化ユニットとしても知られます)
- ユーザの関心を表すと考え操作を埋め込むユーザ行動特性の履歴は、注目ユニットを採用した後、それぞれの関心のために与えられた異なる重みを表現しました
- 注意重量は洞察に(ユーザーの関心の多様性、およびローカルアクティブ化)に対応し、ユーザーの過去の行動と候補広告が計算照合することによって行われます。