ドライな情報 | Ctrip 乗車券 SMS リコールアルゴリズムの最適化実践

著者について

Ctrip アルゴリズムの専門家である Ryan は、パーソナライズされたレコメンデーション、インテリジェント マーケティング、その他の分野に重点を置いています。

Xiaobai は Ctrip のアルゴリズム エンジニアで、インテリジェント マーケティングやユーザーの成長などの分野を研究しています。

1. 背景

今日のインターネットは、トラフィックが王様の時代で活況を呈していますが、トラフィックの配当が徐々に失われ、顧客獲得コストが増加する中、ユーザーの維持が大手インターネット企業の主要な懸念事項となっています。今日のトラフィックレッドオーシャン市場では、特に重要な課題となっているため、ビッグデータと機械学習に基づくインテリジェントなマーケティングテクノロジーの応用が生まれています。

シートリップの鉄道チケット事業では毎週SMSマーケティング活動を行っており、テキストメッセージを送信することで最近注文していない常連顧客を呼び戻し、再購入を促進し、ユーザーの定着率を向上させることを目的としています(ビジネスプロセスは図1に示されています);独自のビジネス戦略です。テキストメッセージ配信の条件を満たすユーザープールの一部をランダムに選択するルールベースの方法. この方法が大規模すぎる, 想起効果が低い, テキストメッセージ送信のROIが低いという問題を解決するために, 我々は, テキストメッセージ送信のROIを提案する.段階的にレスポンスモデルに基づいたコンバージョン率推定モデル、アップリフトモデルに基づいたSMS感度予測モデルと、より科学的に問題を一つずつ定義し、解体、最適化していきます。

0aed3af988e8bef0258d75c5cdc20be7.png

図1 Ctrip鉄道チケットSMSリコール業務フローチャート

2. 問題定義

上記の SMS リコール サービスで解決する必要がある中心的な問題は、次のように抽象的に要約できます。

定義: 条件を満たす常連顧客のユーザー プール (ユーザー サイズを N と仮定) から、戦略またはモデルによって K 人のユーザーが選別されます (SMS コスト制約の下では、通常 K は N 未満です)。これらのユーザー、テキスト メッセージングの全体的なコンバージョン率と ROI。

3. 解決策

3.1 レスポンスモデルに基づくコンバージョン率予測モデル

上記課題に対し、事業戦略に基づくSMS送信履歴のみが存在する場合において、まずレスポンスに基づいたコンバージョン率推定モデルを構築することで、SMSマーケティングの影響を受けた後のユーザーの注文確率を予測することを試みます。モデルを作成し、順序確率を選択します。多数のユーザーがテキスト メッセージを送信します。この方法は、正式に次のように説明できます。

V1

目的: N 人のユーザーの中から、テキスト メッセージを送信した後の順序確率が最も高い K 人のユーザーを見つけます。

方法: 過去の SMS 送信記録に基づいて、SMS 到達後のユーザーのコンバージョン率推定モデルを構築し (サンプル サイズと継続的特徴の高い割合を考慮して、XGBoost を使用します)、ターゲット ユーザー グループをスコア化し、上位 K 個の注文を選択します確率が最も高いユーザー (ラベルの定義: テキスト メッセージの送信後、ユーザーが注文を出した場合はポジティブ サンプル、ユーザーが注文をしなかった場合はネガティブ サンプル)。

実験計画: 図 2 に示すように、まず N 人のユーザーがランダムに 2 つのグループ A と B に分けられます。

a. コントロール グループ: SMS 配信用にグループ A 内の K/2 ユーザーをランダムに選択します。

b. 実験グループ: グループ B では、コンバージョン率推定モデルを使用してスコアを予測し、上位 K/2 人のユーザーをスコアに応じて高位から低位までふるい分けます。

評価指標:オフライン:AUC、TopKの再現率、オンライン:ユーザーコンバージョン率、SMS送信ROI。

8ece8fbea3ac1757c2e8f355eed2938a.png

図 2 v1 実験計画のフローチャート

このプログラムの実験後、実験群は対照群に比べて上記の評価指標において大幅な改善を達成しましたが、注意深く分析した結果、明らかな2つの問題があることが判明しました。

a. 不合理な評価指標:ランダムに選択されたユーザーと比較して、コンバージョン率推定モデルによって選択されたユーザーは、注文確率に自然な偏りを持っています。

b. 実験計画に無理があり、ユーザーの自然想起要因の影響を排除できず(マーケティング活動の有無に関係なく注文する人もいる)、SMS マーケティングの漸進的効果を定量化できない。

V2

上記2つの課題に対し、実験計画と評価指標を以下のように改善しました。

目的: スキーム v1 で見つけた K 人のユーザーが注文を出し、SMS 配信後に収益が増加するかどうかを検証します。

方法:v1と同様にコンバージョン率予測モデルを構築します。

実験計画: 図 3 に示すように、まず N 人のユーザーがランダムに 2 つのグループ A と B に分けられます。

a. コントロール グループ: グループ A はランダムに A1 と A2 に分けられ、K/2 ユーザーはそれぞれ A1 と A2 からランダムに選択され、前者はテキスト メッセージを送信し、後者はテキスト メッセージを送信しません。

b. 実験グループ: グループ B をランダムに B1 と B2 に分割し、コンバージョン率予測モデルによって B1 と B2 からそれぞれ最高スコアを獲得した上位 K/2 ユーザーを選別し、前者はテキスト メッセージを配信し、後者はテキスト メッセージを配信します。テキストメッセージは配信しません。

評価指標: オフライン: Qini スコア、AUUC、オンライン: テキスト メッセージを受信しない人と比較したテキスト メッセージを受信した人のコンバージョン率の増分、およびテキスト メッセージ送信の ROI の増分。

5860b993d813329a410d809780a787ed.png

図 3 v3 実験プロトコルのフローチャート

この方法の実験計画と評価指標はより科学的で合理的ですが、コンバージョン率推定モデルの最適化目標と評価指標の最適化の方向性が一貫していないため、このモデルは SMS 配信の増分効果 (影響力) を予測できません。自然変換係数は考慮されていません)。このため、最適化目標に向けてビジネス シナリオのニーズにより沿ったモデルをさらに構築する必要があります。

3.2 Uplift Modelに基づくSMS感度予測モデル

上記のビジネス シナリオにおける応答モデルの問題を解決し、SMS 配信によってもたらされる漸進的な利点を向上させるために、私たちはアップリフト モデルに基づいて SMS 感度推定モデルをさらに構築しました。

アップリフト モデルは、業界で因果推論と機械学習を組み合わせた最も成熟したアルゴリズムの 1 つです。インテリジェント マーケティングとユーザー拡大の分野で広く使用されています。まず、アップリフト モデルを説明するために使用される、より古典的なマーケティング群衆セグメンテーション図を紹介します。アップリフトモデル:

eb21286880674a627331e10bff0b9000.png

図 4 マーケティング群衆の 4 象限分割図

図中の 4 つの人々のカテゴリーは次のように説明されています。

a. マーケティングに敏感なグループ: マーケティング活動 (テキスト メッセージ、クーポンなど) が届く場合は購入しますが、マーケティング活動が届かない場合は購入しません。

b. 自然なコンバージョン群: マーケティング活動が彼らに届くかどうかに関係なく購入します。

c. 無関心な人: マーケティング キャンペーンが届くかどうかに関係なく、購入しません。

d. マーケティングを嫌う人:マーケティング活動でリーチできない人は買うが、マーケティング活動でリーチできる人は買わない。

明らかに、インテリジェント マーケティングの目標は、図 4 のマーケティングに敏感なグループをできる限り見つけて、マーケティング活動の増分利益を最大化することであり、アップリフト モデルはこの目的のために生まれました。

Uplift Model は、特定の介入因子(Treatment、以下 T と呼びます)が個人の治療効果(Individualtreatment Effect、ITE と呼びます)に及ぼす影響を推定するために使用されるモデルの一種です。上記のビジネス シナリオでは、T=0 はテキスト メッセージを送信しないことを表し (対応する人々のグループは T グループと呼ばれます)、T=1 はテキスト メッセージを送信することを表します (対応する人々のグループはグループ C と呼ばれます)、X と仮定します。はユーザー特性を表し、Y は出力予測値を表し、P はコンバージョン確率 (ITE) を表します。ITE はコンバージョン確率の増分変化であり、形式的には次のように表すことができます。

ITE=P(Y|X=x,T=1)-P(Y|X=x,T=0) (1)

一般的に使用される Uplift モデルには、メタ学習者 (S 学習者、T 学習者、X 学習者など [1]) およびツリーベースの学習者 (Uplift Tree [2]、Causal Forest [3] など)、および Dnn が含まれます。ベースの学習器 (TARNet[4]、CEVAE[5] など) のうち、Causal Forest は主に、ランダム フォレストによるアンサンブル学習のための Uplift Tree に基づいています。業界でより一般的なアプローチは、一般化ランダム フォレスト (GRF) を使用することです。 [6] )。

上記 3 種類の Uplift モデルの特徴をまとめると次のようになります。

機種名 アドバンテージ 欠点がある
メタ学習者 強力なスケーラビリティと比較的安定したパフォーマンスを備えており、基本モデルは既存の分類モデル (LR/GBDT/DNN など) に直接適用できます。 ITE の間接モデリングでは、基本モデルは依然として応答モデルであり、モデルのフィッティング能力を向上させる必要があります。
ツリーベースの学習者 ITE を直接モデル化し、強力なモデル適合能力を実現 エンジニアリングの実装が難しく、データ分布の影響を受けやすく、汎化能力が不安定
DNN ベースの学習者 パラメータの共有、モデル構造と損失関数の柔軟な定義、および強力なモデルフィッティング能力 大量のトレーニング データが必要です。そうでないと、モデルのフィッティング機能を活用することが困難になります。

表 1 Uplift モデルの機能の概要

アップリフト モデルを通じて、ユーザーに対する SMS マーケティングの増分メリットを推定できます。増分メリットの定量的なランキングに基づいて、図 4 に示すマーケティングに敏感なグループを選別できます。実験計画は引き続き、図 4 に示すプロセスに従います。図 3. 注意すべき点 Uplift Model のモデリングには、トレーニング サンプルに対するより高い要件があり、CIA の条件付き独立性の仮定 (Conditional Independent Assumption) に従う必要がありますが、X と T を互いに独立に保つことで、この条件を満たすことができます。この目的を達成するために、実験の実施中、ランダム化された A/B 実験用に少量のトラフィックを予約します。実験グループはテキスト メッセージを送信する一部のユーザーをランダムに選択し、対照グループはテキスト メッセージを送信しない一部のユーザーをランダムに選択します。この実験では、Uplift Model モデリングにより不偏サンプルを提供できます。

4. 実験結果

図 3 に示す実験計画に従って、応答モデルに基づくコンバージョン率推定モデルが SMS マーケティングに漸進的なメリットをもたらすかどうかを検証するために、段階的に 2 つの実験を実施しました。そのオンライン効果は表 2 に示されています。私たちのビジネス シナリオでは、ランダムに選択された人々と比較して、SMS マーケティングはコンバージョン率が高い人々に実際に強いプラスの効果をもたらしていることがわかり、これは比較的成功した試みであると考えられます。

69b1705e3437ba7fe65d1d4673bb7644.png

表 2 オンライン実験の結果: 応答モデルとランダム

レスポンスモデルに基づくコンバージョン率推定モデルはオンライン実験により検証されており、ビジネス指標は大幅に改善しましたが、本稿でのSMSマーケティングの増分効果の分析に基づいて、実験評価の第2段階を継続することを決定しました。オフライン モデリングの結果を表 3 に示します。

e53936cc6090119d1f1cac7a4158135b.png

表 3 オフライン評価結果: 上昇モデルと応答モデル

表 3 は主に、レスポンス モデルと比較して、メタ学習器に基づいて構築されたアップリフト モデルのオフライン指標の改善を評価します。この実験では、コントロール バージョンとしてレスポンス モデルに基づくコンバージョン率予測モデルを使用し、SMS 感度予測を使用しました。 Uplift Model に基づくモデル. 推定モデルは実験版として使用されます. Uplift Model はオフライン評価効果が比較的良好な T 学習器です. オンライン効果は表 4 に示されています:

ea95624e0840ba5472468a2a57fb2575.png

表 4 オンライン実験の結果: 上昇モデルと応答モデル

表 4 からわかるように、アップリフト モデルのオンライン パフォーマンスはオフライン モデルのパフォーマンスと一致しており、レスポンス モデルと比較して、ビジネス指標の大幅な向上を達成しています。このことからも、アップリフト モデルが実際にSMS マーケティングの段階的なメリットを向上させ、SMS マーケティングのためのより機密性の高いグループを発見するのに役立ちます。

5. 探索と分析

上記の 2 段階の実験を実施した後、ビジネス シナリオにおけるさらなるアップリフト モデルの適用可能性を引き続き調査し、現在のビジネスで実験を継続する必要性も評価しました。

Meta-Learner に加えて、GRF に代表される Tree-based 学習器と TARNet に代表される Dnn-based 学習器も評価・比較対象として選択するとともに、S-learner の機能として T を追加する可能性も考慮しました。多くのユーザー特徴によってモデルのトレーニング プロセスが薄められるため、PCA を使用してユーザー特徴の次元を削減し、S 学習器でトレーニングおよび評価する特徴として T を使用します (つまり、表 5 の PCA+S 学習器)。テーブルに v1 を設定し、表 3 の一貫したテスト セットを引き続き使用します。

各モデルのオフライン評価結果は以下の通りです。

709bc679299356eb8f758ea29042c0fb.png

表 5 Uplift モデルのオフライン指標の評価結果 (テスト セット v1)

d675f57dfb555381196b8bf3fc329773.png

図 5 Uplift モデルのオフライン評価結果 - Qini 曲線 (テスト セット v1)

Uplift モデルの漸進的利点をより明確に確認するために、図 5 に示すように Qini 曲線もプロットしました (図の横軸は ITE 推定値によってソートされたサンプルの割合を表し、縦軸は実際の変換を表します)対応する母集団の増分、曲線の下の面積が大きいほど、モデルの効果が高くなります):

表 5 と図 5 からわかるように、TARNet、GRF、PCA+S-learner のパフォーマンスはいずれも優れていますが、これらのモデルは全体のデータ分布の影響を受けやすいことを考慮し、汎化能力を評価する必要があります。各モデルについて、追加で選択しました。後に流行の影響を受けたオンライン テスト データ セット v2 を選択しました。そのオフライン評価結果を図 6 および図 6 に示します。

8369b8cfcdf550017fc4ac2e9bfb6b4c.png

表 6 Uplift モデルのオフライン指標の評価結果 (テスト セット v2)

91ef6d5c35ed6161620f1cacfd67ecf3.png

図 6 Uplift モデルのオフライン評価結果 - Qini 曲線 (テスト セット v2)

表 6 と図 6 からわかるように、PCA+S-learner、GRF、TARNet などのモデルはすべてデータ分布の変化の影響を受けやすく、これらのモデルはモデル構造をさらに最適化し、汎化機能を改善してロバスト性を強化する必要があります。これは今後の検討の方向性の一つですが、その中でもT-learnerは比較的安定した性能とデータ分布の変化への適応能力が高く、現在のビジネスシナリオにより適しています。

6. まとめと展望

シートリップの鉄道切符SMSリコールビジネスは比較的典型的なスマートマーケティングシナリオであり、SMSリコールアルゴリズムの最適化プロセスと結論は次のように要約されます:

a. インテリジェントなマーケティング シナリオの場合、介入要因の増分効果を直接推定するアップリフト モデルは、従来の応答モデルよりも高い適用性を持っています。

b. インテリジェントなマーケティング シナリオでは、介入要因の増分効果を検証するための科学的かつ合理的な実験計画の設計が必要です。上昇モデルのトレーニングと評価に不偏のサンプルを提供するために、トラフィックの一部をランダム化実験用に確保することが最善です。

c. Uplift Model の実装方法は数多くあります (メタ学習器、ツリーベース学習器、Dnn ベース学習器など) その中でも、T-learner は比較的安定しており、ビジネス シナリオに適していますが、必ずしもそうではない可能性があります。シナリオは実際の状況に基づいて分析および評価する必要があります。

d. 連続的かつ複数の介在要因への対処、一般化機能を向上させるためのモデル構造の最適化、多目的クロスドメイン結合モデリングの解決など、Uplift モデルの探求をさらに深める必要があります。

7. 参考文献

  • Künzel SR、Sekhon JS、Bickel PJ 他 機械学習を使用して異種の治療効果を推定するための Metalearners[J]。米国科学アカデミー紀要、2019、116(10): 4156-4165。

  • Rzepakowski P、Jaroszewicz S. 単一および複数の処理による隆起モデリングのデシジョン ツリー[J]。知識と情報システム、2012、32: 303-327。

  • Wager S、Athey S. ランダム フォレストを使用した異種処理効果の推定と推論[J]。米国統計協会ジャーナル、2018、113(523): 1228-1242。

  • Shalit U、Johansson FD、Sontag D. 個人の治療効果の推定: 一般化限界とアルゴリズム[C]//機械学習に関する国際会議。PMLR、2017: 3076-3085。

  • Louizos C、Shalit U、Mooij JM、他 深い潜在変数モデルによる因果効果推論[J]。神経情報処理システムの進歩、2017、30。

  • Athey S、Tibshirani J、Wager S. 一般化されたランダム フォレスト[J]。2019年。

【読書のススメ】

77ff7b942037ef153915dce65742b126.jpeg

 「Ctrip Technology」公開アカウント

  共有、コミュニケーション、成長

おすすめ

転載: blog.csdn.net/ctrip_tech/article/details/131587601