交通 | 共同旅行: グラフ構造に基づいた動的な多時点の供給と需要のネットワークのバランスの取れた測定方法

ここに画像の説明を挿入

論文の解釈

郭望儀、孫竹天、陳泰傑、張雲天

編集者注記

シェアライドは人々の日常的な移動方法を大きく変えました。その背後にある両面プラットフォームをいかに効率的に運用するかが非常に難しい。Didi Chuxing と Lyft はその中でも最高です。このトピックでは、二国間プラットフォームの運用における重要な問題、つまり二国間プラットフォームの運用効率を科学的に測定する方法について説明します。

この特別トピックは上下 2 部に分かれており、順次公開されます。その中で、最初の部分は、統計分野の「四大」ジャーナルの 1 つである米国統計協会ジャーナルに滴滴出行と上海財経大学が発表した論文 [1] を中心に展開し、第 2 部分は、 Lyft. Technology Blog による優れた記事の解釈 [2]。

序章

近年、動的な多時間需給ネットワークは、気候科学、社会科学、神経科学などの分野で応用されており、オンライン配車プラットフォームの動的な需要と供給ネットワークは、多時間動的ネットワークの典型的な応用例です。オンライン配車の運転手と乗客のマッチング問題は、同じ無向 (または有向) グラフG = ( V , E ) G =(\mathbb{V},\mathbb{E}) にあります。G=( V E )「供給」と「需要」の 2 つの非正規化測定シーケンスを照合します。ここで、V \mathbb{V}VE \mathbb{E}Eはそれぞれ頂点のセットと頂点のセットを接続するエッジのセットです。具体的な方法は、頂点集合V \mathbb{V}のように、都市を何百もの重なり合わないグリッドに分割することです。V、エッジ構造E \mathbb{E}Eは道路網と位置関数によって決まります。各決定期間中の注文需要とアイドル状態のドライバーの分布を観察することにより、注文分散戦略を使用して、顧客のリクエストと周囲のアイドル状態のドライバーの可能性を照合します。

この論文で検討する基本的な問題は、両面市場、特に配車プラットフォーム (Uber や DiDi など)の動的な多時間的需給ネットワークを説明する際に、空間一致の程度をどのように定量化するかということです。転送コストに基づく一致度の定義では、最適一致度の計算とは、供給ネットワーク分布を需要ネットワーク分布に移行するための最適な転送戦略、つまり注文配分戦略を計算することを意味するため、多時点の一致度は需要と供給のネットワークは非常に重要に研究されています。この問題を解決するには、まず重み付きグラフ構造( G , W , C ) (G, W, C) を導入します。( G C )市内の交通網と交通費について説明します。具体的には、各市場を N 個の互いに素な領域に分割し、V = { v 1 , . . . , v N } \mathbb{V} = \{v_1, . . . , v_N\} として表される頂点として扱いますV={ v1... vN} . E \mathbb{E}にしてみましょうE は、 ( vi , vj ) ∈ E ⊂ V × V (vi, vj) ​​∈ \mathbb{E} ⊂ \mathbb{V} × \mathbb{V} となるような、考えられる頂点のペア間のエッジのセットです( v i vj ) _EV×Vは非負の重みwij w_{ij}wイジ(送料など)。すべてのw_{ij}のためにwイジ、ボンウィジw_{ij}wイジ重み付きグラフ構造は、無向 (または有向) グラフG = ( V , E ) G =(\mathbb{V},\mathbb{E})で構成されます。G=( V E )と重み行列G = ( V , E ) G =(\mathbb{V},\mathbb{E})G=( V E),其中 w i j w_{ij} wイジは負ではない重みです。w_{ij} さんからwイジvj v_jvjのグラフベースの輸送コストは次のように定義されます。cij = min K ≥ 0 , ( ik ) k = 0 K : vi → vj { ∑ kwik , ik + 1 : ∀ k ∈ [ [ 0 , K − 1 ] ] , ( vik , vik + 1 ) ∈ E } c_{ij} = min_{K≥0,(i_k)_{k=0}^{K}:vi→vj} \{\sum_k w_{i_k,i_{k+ 1} } : ∀k ∈[[0, K - 1]],(v_{i_k}, v_{i_k+1}) ∈ \mathbb{E}\}cイジ=_K 0 , ( i)k = 0K: v i v j{ wk + 1:∀k_[[ 0 ,K1 ]] ( vv+1 _)E},其中 ( i k ) k = 0 K : v i → v j (i_k)_{k=0}^{K} : v_i → v_j (私は)k = 0K:v私はvj代表以 v i 0 = v i v_{i_0} = v_i v0=v私はvi K = vj v_{i_K} = v_jから始めますvK=vjGGの終わりG byE \mathbb{E}Eの任意のパス。したがって、cij c_{ij}cイジvi v_iからですv私はvj v_jvjvi v_iからの測地線距離v私はvj v_jvjオブジェクトのユニットを輸送するための最小コスト。したがって、( G , W ) (G, W)では( G W )は輸送コスト行列を定義し、C = (cij) ∈ RN × NC = (c_{ij}) ∈ R^{N×N}C=( cイジ)RN × N

次に、各時間間隔および( G , W , C ) (G, W, C)における需要と供給の質の差を定量化するために、距離を導入する必要があります。( G C )時間の経過による違い。与えられた時間間隔で、ν j = ν ( vj ) ν_j = ν(v_j)nj=n ( vj)μ j = μ ( vj ) μ_j= μ(v_j)メートルj=m ( vj)は頂点vj v_jvj2 つのルベーグ尺度の点質量ν νmμは、それぞれタクシー配車プラットフォーム ノードvj v_jvjユーザーリクエストとその中で利用可能なドライバーの数。各期間の需要と供給のネットワークは、( G , W , C ) (G, W, C)としてモデル化できます。( G 2 つの離散ルベーグはC上のμ μを測定します)むわん__n

最適輸送理論に基づいたワッサーシュタインのような計量法は、複雑な空間内の物体を測定するための効果的なツールであることが証明されています。ただし、既存の Wasserstein のようなメトリクスは、セクション 2.1 ( G、W、C) で詳細に定義されている ( G 、 W 、 C ) には直接適用できません。( G C ) 2 つの不均衡測定値の比較。したがって、著者らはグラフベースの平衡計量 (GEM) を導入し、それを不均衡な最適輸送問題として定式化します。

1. グラフ構造に基づくバランス測定方法

1. 既存の Wasserstein クラスの距離

2 つの分布間の差を測定するための古典的な標準は数多くありますが、それらは大きく 2 つのカテゴリに分類できます。最初のカテゴリはピクセルの差によって定義される距離であり、2 番目のカテゴリは転送コストに基づいて定義される距離です。L p L_pLp距離、TV 距離、KL 発散などが最初のタイプの測定基準であり、ヘリンジャー距離は典型的なケースです。
DH 2 ( μ , v ) = 0.5 ∫ X ( d μ / d ν 0 − d ν / d ν 0 ) 2 d ν 0 D_H^2(\mu, v)=0.5 \int_X\left(\sqrt{d \mu / d \nu_0}-\sqrt{d \nu/ d \nu_0}\right)^2d \nu_0DH2( m v )=0.5×(d m / d n0 いいえ/いいえ_ _0 )2d n0、メジャーν 0 で 2 つの分布を測定することを意味します \nu_0n0の二乗平均平方根の差。しかし、このクラスのピクセル差ベースのメトリクスには、2 つの大きな欠点があります。

  • ヘリンジャー指数は、異なる場所間の接続関係を考慮していません。つまり、XXは考慮されていません。Xの位相分布。
  • ヘリンジャー指標は正規化する必要があります。つまり、μ ( X ) = ∫ X d μ = ν ( X ) = ∫ X d ν \mu(X)=\int_X d \mu=\nu(X)=\ int_X d \nm ( X )=×_=n ( X )=×d n

上記 2 つの欠点を解決するために、一部の学者は、Wasserstein 距離など、転送コストに基づく 2 番目のタイプの距離を提案しました。これは、組み合わせ最適化などの割り当て問題の分野で深く研究されています。ワッサーシュタイン距離は次のように定義されます。
DW ( μ , v ∣ c ) = inf ⁡ γ ∈ M + ( X × Y ) { ∫ X × Y cd γ + ι { = } ( P # X γ ∣ μ ) + ι { = } ( P # Y γ ∣ v ) } \begin{aligned} & D_W(\mu, v \mid c) =\inf _{\gamma \in M_{+}(X \times Y)}\left \{ \int_{X \times Y} cd \gamma+\iota_{\{=\}}\left(P_{\#}^X \gamma \mid \mu\right)+\iota_{\{=\} }\ left(P_{\#}^Y \gamma \mid v\right)\right\} \end{aligned}DW( m vc )=γ M+( X × Y )f{ X × Yc d γ+{ = }( P#×cメートル+{ = }( P#cv ) }

其中 X , Y X,Y × Yは 2 つのハウスドルフ位相空間であり、損失関数 c はX × Y → R ∪ { ∞ } X \times Y \rightarrow R \cup\{\infty\}バツ×YR{ }マッピング、伝達関数γ \gammaγ は非負の測度γ ∈ M + ( X × Y ) \gamma \in M_{+}(X \times Y)cM+( X×Y ),等式制約{ = } ( α ∣ β ) \iota_{\{=\}}(\alpha \mid \beta){ = }( _β )は、 α = β \alpha=\betaの場合を意味しますある=βは 0 で、残りは無限大です。この測定の前提条件は、μ ∈ M + ( X ) \mu\in M_{+}(X) であるメートルM+( X )ν ∈ M + ( Y ) \nu\in M_{+}(Y)nM+( Y )合計量は同じです、つまりμ ( X ) = ν ( Y ) \mu(X)=\nu(Y)m ( X )=ν ( Y )P # X γ と P # Y γ P_\#^X\gamma および P_\#^Y\gammaP#×ガンマp#γはそれぞれγ \gammaγの 2 つの周辺分布

この方法では、最適な割り当てスキームγ \gammaを取得できます。γですが、総供給と総需要が同じでない場合、ワッサーシュタイン距離は実行可能な解を得ることができず、実際には、総供給と需要の分布には通常不一致が生じます。したがって、一部の学者は、発散に基づく不平衡輸送問題の測定方法を提案しています。最初のϕ − \phi-ϕ 発散の定義。まず、エントロピー関数ϕ \phiϕ, forμ , v ∈ M ( T ) , d μ dvv + μ ⊥ \mu, v \in M(T), \frac{d \mu}{dv} v+\mu^{\perp}メートルvM ( T ) DV _ _v+メートルμ \μνのμ \nuνのルベーグ分解。発散D ϕ D_\phiDϕと定義されている

D ϕ ( μ ∣ ν ) : = ∫ T φ ( d μ dv ) dv + φ ∞ ′ μ ⊥ ( T ) D_\phi(\mu|\nu):=\int_T \varphi\left(\frac{d \mu}{dv}\right) d v+\varphi_{\infty}^{\prime} \mu^{\perp}(T)Dϕ( μ ν ):=Tファイ(DV _ _)DV _+ファイメートル (T)Wasserstein 関数 (GWD)から独立:
D φ 1 , φ 2 ( μ , ν ∣ c ) = inf ⁡ γ ∈ M + ( X × Y ) { ∫ X × Y cd γ + D φ 1 ( P # X γ ∣ μ ) + D φ 2 ( P # Y γ ∣ v ) } \begin{aligned} D_{\row_1, \row_2}(\mu, \nu \mid c) \quad=\inf _{\gamma \in M_{+}(X \times Y)}\left\{\ int_{X \times Y} cd \gamma+\mathcal{D}_{\varphi_1}\left(P_{\#}^X \gamma\mid \mu\right)+\mathcal{D}_{\varphi_2} \left(P_{\#}^Y \gamma\中右)\right\} \end{整列}Dファイ1f2( m nc )=γ M+( X × Y )f{ X × Yc d γ+Dファイ1( P#×cメートル+Dファイ2( P#cv ) }.

GWD はϕ − \phi-を使用します輸送計画と供給尺度および需要尺度の 2 つの不均衡尺度を定量化するためのϕ −発散μ \muμν \nuνと の間の偏差ただし、GWD 測定はエントロピー関数ϕ \phiϕの尺度、その解の結果γ ∗ \gamma^*c∗ には物理的な意味がないため、信頼できるスケジューリング スキームを提供できません。さらに、GWD には次の 2 つの主な問題があります。

  • 多くの実用的な両面プラットフォームでは、一方のメジャーの粒子のみが移動を許可され、もう一方のメジャーは固定されています。たとえば、タクシー配車プラットフォームでは、アイドル状態のドライバーの配分のみが可能で、顧客の注文はできません。移動しました。
  • 需要と供給のネットワークでは、輸送コストは通常​​、定数ではなく分布であり、頂点からそれ自体への輸送コストはゼロではない場合があります。

2.グラフベースの均衡指標

上記の研究ギャップに応えて、この論文では、最初に重みマップ問題( G , W , C ) (G,W,C) において、グラフベースの平衡メトリクス (GEM) を提案します。( G C )では、需要と供給を 2M + ( V ) M_+(\mathbb{V})M+( V ) μ 、 ν \mu,\nuを測定しますメートルν,其中 μ \mu μの粒子は移動できます、ν \nuνの粒子は固定されています。N i \mathcal{N}_iN私はノードvi v_iを定義しますv私は隣接するノードのセット。次に、一方通行などの理由により、vi ∈ N j v_i\in\mathcal{N}_jv私はNjvj ∈ N i v_j\in\mathcal{N}_i であるという保証はありませんvjN私はたとえば、次のような GEM があります。
ρ λ ( μ , v ∣ G , C ) = inf ⁡ μ ~ ∈ M + ( V ) , γ ∈ M + ( V × V ) { ∣ v − μ ~ ∣ + λ ∫ V × V cd γ } \begin{aligned} & \rho_\lambda(\mu, v \mid G, C) \\ & =\inf _{\tilde{\mu} \in M_{+}(\mathbb { V})、\gamma \in M_{+}(\mathbb{V}\time \mathbb{V})}\left\{|v-\assignment{\mu}|+\lambda \int_{\mathbb { V}\time\mathbb{V}}cd\gamma\right\}\end{aligned}r( m vG C )=メートル~∈M _+( V ) γ M+( V × V )f{ vメートル~+V × Vc d γ }

s 。と。∣ μ ∣ = ∣ μ ~ ∣ 、 ( P # 1 V γ ) ( vi ) = ∑ vj ∈ N i γ ( vi , vj ) = μ i および ( P # 2 V γ ) ( vi ) = ∑ vi ∈ N j γ ( vj , vi ) = μ ~ i , \begin{aligned} st & |\mu|=|\tilde{\mu}|, \quad\left(P_{\# 1}^V \gamma\right )\left(v_i\right)=\sum_{v_j \in \mathcal{N}_i} \gamma\left(v_i, v_j\right)=\mu_i \text { and } \\ & \left(P_{\ # 2}^V \gamma\right)\left(v_i\right)=\sum_{v_i \in \mathcal{N}_j} \gamma\left(v_j, v_i\right)=\tilde{\mu}_i 、\end{整列}s μ =メートル~( P#1Vc )( v私は)=vj∈N _私はc( v私はvj)=メートル私は と ( P#2Vc )( v私は)=v私は∈N _jc( vjv私は)=メートル~私は

ここで、λ \ラムダλは非負のハイパーパラメータであり、γ \gammaγμ \muμ はμ ~ \チルダ{\mu}に転送されますメートル~GEM は本質的に、ワッサーシュタイン距離のL 1 L_1と需要と供給の差です。L1標準。非平衡最適輸送問題に対する既存の解​​決策と比較して、この論文で提案する GEM には 2 つの利点があります。

  • 実際のトポロジ情報を考慮すると、図に示すように、隣接ノード間のトランスポート アクションのみが許可されます。
  • λ \lambdaを渡すことができます需要と供給の一致度と輸送コストの比率をλで調整します。モデルのλ \lambda は通常、データ駆動型の方法によって選択されます。ラムダ

    GEM ではトポロジが考慮されますが、次の図の GWD ではトポロジが考慮されません。

2. 計算方法

GEM の計算方法は主に 2 つのステップに分かれており、第 1 ステップは元の定義をコンパクトな形で再構成し、絶対値を線形化するステップ、第 2 ステップは LP 問題を二重化し、決定変数の次元を削減するステップです。計算解のプロセスを記述するためには、いくつかの変数をコンパクトな形式で定義する必要があります。最初にGEM の離散形式に従って定義します
ρ λ ( μ , v ∣ G , C ) = min ⁡ γ ∈ Γ { ∥ v − μ ~ ∥ 1 + λ ∑ vi ∈ V ∑ vj ∈ V cij γ ij } ∑ vj ∈ N および γ ij = μ に従うi , ∑ vj ∉ N i γ ij = 0 , ∀ i , および μ ~ i = ∑ vi ∈ N j γ ji for ∀ vi ∈ V , \begin{aligned} & \rho_\lambda(\mu, v \mid G, C)=\min _{\gamma \in \Gamma}\left\{\|\ボール シンボル{v}-\チルダ{\ボール シンボル{\mu}}\|_1+\lambda \sum_{v_i \ in \ mathbb{V}} \sum_{v_j \in \mathbb{V}} c_{ij} \gamma_{ij}\right\} \\ & \text { の対象 } \sum_{v_j \in \mathcal{ N} _i} \gamma_{ij}=\mu_i, \quad \sum_{v_j \notin \mathcal{N}_i} \gamma_{ij}=0,\quad\forall i, \quad \text { and } \ \ & \tilde{\mu}_i=\sum_{v_i \in \mathcal{N}_j} \gamma_{ji} \text { for } \forall v_i \in \mathbb{V},\end{aligned}r( m vG C )=γ Γ ∥v _メートル~1+v私はVvjVcイジcイジ  の対象となる vj∈N _私はcイジ=メートル私はvj/N私はcイジ=0 ∀i _ と メートル~私は=v私は∈N _jc∀v ために 私はV

对于 v j ∉ N i v_j \notin \mathcal{N}_i vj/N私はγ ij \gamma_{ij}cイジ、その値は 0 でなければならないので、γ ~ = V ec { γ ij , j ∈ N i } ∈ RN 0 × 1 \tilde{\gamma}=Vec\{\gamma_{ij},j\in\mathcal { を使用します。 N}_i\}\in R^{N_0\times1}c~=Vec { c _ イジjN私は}RN0× 1でγ \gammaを簡略化しますγ,其中 N 0 = ∑ i = 1 N n i N_0 = \sum_{i=1}^N n_i N0=i = 1Nn私はすべてのノードの隣接ノードの合計数を表します。この単純化により、複雑度はO ( N 2 ) O(N^2)まで変化します。O ( N2 )O(N 0 ) O(N_0)に減少O ( N0後続の計算の便宜のために、ここでA 1 、A 2 A_1、A_2122 N × N 0 N\times N_0N×N0A 1 A_1の行列1の第∑ j = 1 i − 1 nj + 1 \sum_{j=1}^{i-1}n_j+1j = 1i 1nj+1 ∑ j = 1 inj \sum_{j=1}^{i}n_jj = 1私はnjの要素はすべて 1、他の要素はすべて 0、A 2 A_22すると、∑ p = 1 j − 1 np + 1 \sum_{p=1}^{j-1}n_p+1p = 1j 1np+1から∑ p = 1 jnp \sum_{p=1}^{j}n_pp = 1jnp中間は 1、残りは 0。A1A_11構造の概略図を以下に示します。

すべてのパスが双方向に接続されている場合、つまり、問題はγ ij = γ ji \gamma_{ij}=\gamma_{ji}という無向グラフです。cイジ=c,则 A 1 A_1 1 A 2 A_2 2まったく同じ。なぜならここではA 1 A_11 A 2 A_2 2それぞれP # 1 V γ P_{\# 1}^V \gammaを表しますP#1VγP # 2 V γ P_{\# 2}^V \gammaP#2V

C ~ ∈ RN 0 × 1 \widetilde{C} \in R^{N_0 \times 1} を定義します。C RN0× 1は、各ルートの輸送単価を表すコスト ベクトルです。したがって、次のように定義します。

A = [ A 1 0 0 0 ∥ A 2 IN − IN 0 ∥ A 2 − IN 0 IN ] , b = [ µ T , v T , v T ] T , A=\left[\begin{array}{llllllllll } A_1 & \mathbf{0} & \mathbf{0} & \mathbf{0} \| A_2 & \mathbf{I}_N & -\mathbf{I}_N & \mathbf{0} \| A_2 & -\mathbf{I}_N & \mathbf{0} & \mathbf{I}_N \end{配列}\right],\\\mathbf{b}=\left[\ボール記号{\mu}^ T 、\ballsymbol{v}^T、\ballsymbol{v}^T\right]^T、=[1000 A2NN0 A2N0Nb=[ mvv]T

ただし、μ = ( μ 1 , … , μ N ) T , A ∈ R 3 N × ( N 0 + 3 N ) , b ∈ R 3 N \boldsymbol{\mu}=\left(\mu_1, \ldots, \mu_N\right)^T, A \in R^{3 N \times\left(N_0+3 N\right)}, \mathbf{b} \in R^{3 N}メートル=( m1メートルN)TR3N × ( N _0+ 3N ) _bR3インド \boldsymbol{\rm{I}}_NNは単位行列です。

上記のコンパクトな変数を定義に導入すると、次のように再構成できます。
min ⁡ { ∥ v − A 2 γ ~ ∥ 1 + λ C ~ T γ ~ } ただし、A 1 γ ~ = μ 、 γ ~ ≥ 0 を条件とします。 \min \ left\{\left\|\boldsymbol{v}-A_2 \widetilde{\gamma}\right\|_1+\lambda \widetilde{C}^T \widetilde{\gamma}\right\}\\ \text{ subject to}\quad A_1 \tilde{\gamma}=\mu, \tilde{\gamma} \geq 0.{ v2c 1+C Tc }の対象となる1c~=メートルc~0.

S ∈ RN × 1 S\in R^{N\times1} を導入しますSR非線形項を線形化した後のN × 1は、次と同等です。

min ⁡ { 1 TS + λ C ~ T γ ~ } A 1 γ ~ = μ 、 A 2 γ ~ + S ≥ v 、 A 2 γ ~ − S ≤ v 、 γ ~ ≥ 0 、および S ≥ 0 の条件下、 . \begin{aligned} & \min \left\{\mathbf{1}^T S+\lambda \width{C}^T \width{\gamma}\right\} \\ &\text { の対象 } A_1 \ チルダ{\gamma}=\ボール シンボル{\mu}、A_2 \wide チルダ{\gamma}+S \geq \ボール シンボル{v}、A_2 \チルダ{\gamma}-S \leq \ボール シンボル{v }, \tilde{ \gamma} \geq 0, \text { および } S \geq 0, \end{aligned}{ 1TS _+C Tc }A の対象となる 1c~=メートル2c +Sv2c~Svc~0  そして S0

上記の線形計画問題は、コンパクトな形式で記述することができます。
min ⁡ X { BTX } は、 AX = b 、 X ≥ 0 、 \begin{aligned} &\min _X\left\{B^TX\right\}\\ を条件とします。 &\ text { subject to } AX=\mathbf{b}, X \geq 0, \end{aligned}バツ{ BTX }_A X の対象となる =b バツ0

其中B = ( λ C ~ T , 1 T , 0 T , 0 T ) TB=\left(\lambda \widetilde{C}^T, \mathbf{1}^T, \mathbf{0}^T, \ mathbf{0}^T\right)^TB=( lC 100T ,$ X=\left(\チルダ{\ガンマ}^T, S^T, \boldsymbol{w}_1^T, \boldsymbol{w}_2 T\right) T,$ w 1 T ,w2T \boldsymbol{w}_1^T、\boldsymbol{w}_2^Tw1Tw2Tは、不等式制約が等式制約に変換されるスラック変数であり、その行列分解は次の図のように表すことができます。

この典型的な LP 問題の双対形式は次のとおりです。

max ⁡ y ∈ R 3 N { b T y } は AT y ≤ B \begin{aligned} &\max _{\mathbf{y} \in R^{3 N}}\left\{\mathbf{b に従う}^T \mathbf{y}\right\} \\&\text { の対象 } A^T \mathbf{y} \leq B \end{aligned}y R3N_ _マックス{ bタイ}_A の対象となる Ty _B

マトリックス分解の概略図によれば、次のようになります。

双対性後の LP 問題の可変次元は、N 0 + 3 N N_0+3Nになります。N0+3N3Nに縮小3N._ _ _

3. 相乗り旅行プラットフォームの 3 つの側面における GEM の適用

まず、各都市の環境に基づいて動的な重みをもつグラフ構造を確立する必要があります。まず、都市を重複しないNNに分割します。N個の正六角形、N i = ∪ k = 0 2 N ik \mathcal{N}_i=\cup_{k=0}^2 \mathcal{N}_i^kN私は=k = 02N其中 N i k \mathcal{N}_i^k Nνと\nu_in私はkth _Kレベルの外部ノード。0 番目のレベルにはそれ自体しかありません。ビルドG = ( V , E ) G=(\mathbb{V}, \mathbb{E})G=( V E )の場合、次のステップはW t = ( wijt ) W_t=(w_{ijt})W=( wijt _),其中 w i j t w_{ijt} wijt _ttにある 2 つの頂点です期間tの距離、 W t W_tWC t = ( cijt ) C_t=(c_{ijt})を計算します。C=( cijt _最後に、動的ウェイト マップ( G 、 W t 、 C t ) (G,W_t,C_t) を( G WC)

1. 回答率の予測

インデックスの定義

まず、観測された動的供給ネットワークと需要ネットワーク間の最適な距離をリアルタイムで測定し、O = { ( oit ) } t \mathbf{O}=\{(o_{it})\} を定義することができます。 _t={( o) }, D = { ( dit ) } t \mathbf{D}=\{(d_{it})\}_tD={( d) }はそれぞれ需要と供給のダイナミクスです。μ t = ( dit ) i 、 ν t = ( oit ) i \mu_t=(d_{it})_i,\nu_t=(o_{it})_i を定義しますメートル=( d)私はn=( o)私は, ここで、i はノードν i \nu_iです。n私はの指標。次に、ρ ( t ) = ρ λ ( μ t , vt ∣ G , C t ) \rho(t)=\rho_\lambda\left(\mu_t, v_t \mid G, C_t\right) を解きます。p ( t )=r( mvG C)期間 t の最適な輸送戦略を取得するため( μ ~ t ∗ = ( d ~ it ∗ ) i , γ t ∗ ) \left(\tilde{\mu}_{t *}=\left(\tilde{d }_{it *}\right)_i, \gamma_{t *}\right)(メートル~ _=(d_ _)私はc _

この論文では、各頂点ν i \nu_in私はの最適な需給比は、oit o_{it} の需要として定義されます。ああ「最適供給」よりd ~ it ∗ + ι { = } ( d ~ it ∗ = 0 ) \tilde{d}_{it *}+\iota_{\{=\}}\left(\tilde{ d }_{it *}=0\right)d_ _+{ = }(d_ _=0 ) 、 DSr ⁡ it \operatorname{DSr}_{it}として示されます。DSr、定義の 2 番目の項は、分母が 0 にならないようにすることです。同時に、各瞬間における各頂点の最適な需要と供給の差をDSd ⁡ it = oit − d ~ it ∗ \operatorname{DSd}_{it}=o_{it}-\tilde{d として定義できます。 }_{ それ *}DSd=ああd_ _

上記の 2 つの定義に基づいて、GEM 測定方法( DSr ⁡ it 、 DSd ⁡ it ) (\operatorname{DSr}_{it},\operatorname{DSd}_{it}) に基づくことができます。( DSrDSd)を使用して時空間マップを作成します。さらに、 ( DSr ⁡ it , DSd ⁡ it ) (\operatorname{DSr}_{it},\operatorname{DSd}_{it}) とします。( DSrDSd)より広い時間スケールT 0 \mathcal{T}_0T0そしてより大きな領域V 0 ∈ V \mathbb{V}_0\in \mathbb{V}V0Vであるため、この記事では加重平均需給比と加重平均需給差を定義します。

DSr ⁡ T 0 ( V 0 ) = ∫ t ∈ T 0 ∑ i ∈ V 0 (DS ritdt ∫ t ∈ T 0 ∑ i ∈ V 0 ウィットdt および ADSd ⁡ T 0 ( V 0 ) = ∫ t ∈ T 0 ∑ i ∈ V 0 wit ∣ DS dit ∣ dt ∫ t ∈ T 0 ∑ i ∈ V 0 witdt \begin{aligned} \operatorname{DSr}_{\mathcal{T}_0}\left(\mathbb{V}_0\right ) & =\frac{\int_{t \in \mathcal{T}_0} \sum_{i \in \mathbb{V}_0} w_{it} \mathrm{DSr}_{it} dt}{\int_ {t \in \mathcal{T}_0} \sum_{i \in \mathbb{V}_0} w_{it} dt} \text { and } \\ \operatorname{ADSd}_{\mathcal{T}_0 }\left(\mathbb{V}_0\right) & =\frac{\int_{t \in \mathcal{T}_0} \sum_{i \in \mathbb{V}_0} w_{it}\left |\mathrm{DSd}_{it}\right| dt}{\int_{t \in \mathcal{T}_0} \sum_{i \in \mathbb{V}_0} w_{it} dt} \end{aligned}DSrT0( V0)ADSdT0( V0)=t T0i V0wdt _t T0i V0wDSrdt _ と =t T0i V0wdt _t T0i V0wDSddt _

この定義ではw_{it} を使用しますwoit o_{it}に設定可能ああ需要の高いノードの指標を強調します。配車市場の良好な均衡は、より小さい( DSr ⁡ it 、 DSd ⁡ it ) (\operatorname{DSr}_{it},\operatorname{DSd}_{it}) に対応します。( DSrDSd)

事例分析

この記事では、2018年4月21日から5月20日までのDiDi GAIAラボの需要データとアイドルドライバーデータを使用しています。都市をN = 800 に分割します N=800N=各辺の長さが 1400m の800 個の六角形のサブ領域で、辺の重みwij w_{ij}wイジは 2 つのサブ地域間の走行距離であり、各地域の 1 分あたりのアイドル運転手の数と注文数を計算します。

注文応答率は、通常、応答された注文の数を注文の合計数で割ったものとして定義されます。このペーパーでは、過去のデータに基づいて、次の 10 分間と 60 分間の応答率の対数値を予測します。まず、ヘリンジャー距離、L2 距離、ワッサーシュタイン距離、GEM をそれぞれ 10 分間隔で計算しました。このうち、L2 距離とヘリンジャー距離は、連続 10 回の 1 分間隔の距離によって計算されます。ワッサーシュタイン距離の計算では、まず、連続 10 回の 1 分間隔の需給データを正規化して、実現可能なワッサーシュタイン距離が確実に得られるようにする必要があります。入手できます。次に、対応する重みを通じて 10 分ごとに集計された Wasserstein 距離メトリックを取得します。GEM 関連のインジケーターについては、まず分ごとのDSr ⁡ it \operatorname{DSr}_{it}を計算します。DSrそして、重み付けされた集計DSr ⁡ T ( V ) \operatorname{DSr}_{\mathcal{T}}(V) を10 分ごとに計算します。DSrT( V )

このペーパーでは、パーセント絶対誤差 (MAPE) と二乗平均平方根誤差 (RMSE) を使用して、対応する指標が予測精度に及ぼす影響を測定します。この論文では、データセットをトレーニングセットとテストセットに分割し、線形回帰法を使用して、過去 10 期間の指標と履歴指標を使用して、次の 6 瞬間の注文応答率の対数値を予測します。 5日前の同じ時間帯のこと。t+10、t+60 t+10、t+60t+10 t+60 はそれぞれ短期と長期の予測を表します。結果は下の図に示されています。GEM が他の 3 つの指標よりも大幅に優れていることがわかります。従来の指標では、動的な伝達とシステムを完全に説明できない可能性があります加重グラフのバランス。

さまざまな指標を使用した応答率の予測結果

2. 注文のスケジュール戦略

履歴データの供給側と需要側の情報を使用する{ ( DS rit , DS dit ) : ( vi , t ) ∈ V × T 0 } \left\{\left(\mathrm{DSr}_{it}, \mathrm { DSd}_{it}\right):\left(v_i, t\right) \in \mathbb{V} \times \mathcal{T}_0\right\}{ ( DSrDSd):( v私はt )V×T0}を使用すると、幅広い双方向プラットフォームのスケジューリング戦略を設計できます。従来のスケジューリング戦略は、最近接原則や先着順戦略など、現在のニーズを満たすことに重点を置いていますが、その多くは都市の空間構造を活用できず、最適なスケジューリングを得ることができません。 。このペーパーでは、GEM を使用して、より過去の需給ネットワーク情報を記録し、現在の注文の平均期待収益に対する GEM の影響について説明します。いいえ、N d N_o、N_dNああNdそれぞれ注文数とアイドル状態のドライバーの数を表しますlがオーダー $k に割り当てられる
の場合、二部グラフの重みとしてのA(k,l)二部グラフの重みは、ドライバーの期待される報酬です。二部グラフの重みは、ドライバーの期待される報酬です。x_{kl}$ は 1 で次数の分布を表します。したがって、グローバルな順序割り当て戦略は、次の 2 部グラフ マッチング問題として要約できます。
arg ⁡ max ⁡ xkl ∑ k = 0 N d ∑ l = 0 N o A ( k , l ) xkl , st ∑ k = 0 N dxkl ≤ 1 ∀ l ; ∑ l = 0 N oxkl ≤ 1 ∀ k ; xkl = 0 if ckl > ϵ ∀ k , l . \begin{aligned} & \arg \max _{x_{kl}} \sum_{k= 0}^{ N_d} \sum_{l=0}^{N_o} A(k, l) x_{kl}, \quad \text { st } \sum_{k=0}^{N_d} x_{kl} \leq 1 \quad \forall l ; \\ & \sum_{l=0}^{N_o} x_{kl} \leq 1 \quad \forall k ; x_{kl}=0 \text { if } c_{kl }>\epsilon \quad \forall k, l . \end{aligned}arg _バツkl _マックスk = 0Ndl = 0NああA ( k ,l ) xkl _ セント k = 0Ndバツkl _1∀l ; _l = 0Nああバツkl _1∀k_バツkl _=c の場合は 0kl _>ϵ∀k_l .

制約は、各注文が最大 1 人のドライバーに割り当てられるようにするために使用され、各ドライバーは 1 つの注文のみを受け取ることができます。実際の距離で遠すぎる場合、ドライバーはオーダーをお受けできません。

順序割り当ての 2 部グラフ マッチング問題

この論文では主に異なるA ( k , l ) A(k, l)に基づいて比較します。A ( k ,l ) 3 つのスケジュール戦略。1 つ目は、現在の分布リターンのみを考慮することですA ( 1 ) ( k , l ) = α 1 rk − α 2 ckl 、 A^{(1)}(k, l)=\alpha_1 r_k-\alpha_2 c_{kl } 、( 1 ) (kl )=ある1rある2ckl _これら 2 つの項目は、収益と距離コストです。2 番目の戦略はA ( 2 ) ( k , l ) = α 1 rk − α 2 ckl + α 3 { η Δ tlk V 1 ( slk ' ) − V 1 ( sl ) } , A^{(2)} ( k, l)=\alpha_1 r_k-\alpha_2 c_{kl}+\alpha_3\{\eta^{\Delta t_{lk}}V_1(s'_{lk})-V_1(s_{l})\ } 、( 2 ) (kl )=ある1rある2ckl _+ある3{ nΔt _lk _V1( slk _)V1( s)} 追加された 3 番目の項目は、現在のアクションが将来の収益に与える影響を考慮するために使用されます。ここで、V 1 ( s ) V_1(s)V1( s )は、現時点からその日の終わりまでの期待収益です。3 番目の戦略はA ( 3 ) ( k , l ) = A ( 2 ) ( k , l ) + α 4 { η Δ tlk V 2 ( slk ' ) − V 2 ( sl ) } , A^{(3 ) }(k, l)=A^{(2)}(k, l)+\alpha_4\{\eta^{\Delta t_{lk}}V_2(s'_{lk})-V_2(s_{ l })\}、( 3 ) (kl )=( 2 ) (kl )+ある4{ nΔt _lk _V2( slk _)V2( s)}では、需要と供給の一致度を測定するために新しい項目が使用されます。ここで、V 2 ( s ) = ν t ( v ) − μ ~ t ( v ) V_2(s)=\nu_t(v)-\tilde {\mu }_t(v)V2( s )=n( v )メートル~( v )は GEM 定義、V 2 ( . ) V_2(.)V2( . )項目により、近くのドライバーが顧客に応答する可能性が大幅に高まります。数値テスト例を以下の図に示します。その結果は、GEM に基づく 3 番目の戦略がドライバーのより高いメリットと応答率を得ることができることを示しています。

さまざまなスケジューリング戦略の比較

3. 戦略の評価

この論文で提案されている GEM メトリクスの重要な用途は、2 つ (またはそれ以上) の配車プラットフォームのスケジュール戦略を直接比較することです。重要なアイデアは、同じプラットフォーム環境における 2 つの競合する戦略セットの GEM 間に大きな違いがあるかどうかを検出することです。プラットフォーム内の需要と供給の結合分布を考慮すると、GEM が小さいほど、注文応答率、注文履行率、ドライバーの労働時間など、多くのグローバルな運用指標が向上します。これらの全体的な運用指標と比較して、GEM は配車プラットフォームの運用効率をより直接的に測定します。

この論文では、2018 年 12 月 3 日から 12 月 16 日までの同じ都市 H の別の需要と供給のデータセットを使用して、2 つのオーダー スケジューリング戦略間の有効性を比較する実験を実施しました。2 つの戦略は連続 30 分間隔で交互に行われました。さらに、この実験は最初の 30 分のベースライン ポリシーから始まり、1 日を通じて 30 分ごとにポリシーを変更し、別の日にその順序を逆にします。この実験には、11 月 12 日から 11 月 25 日までに取得した履歴データを直接比較として使用し、ベースライン ポリシー自体と比較する A/A テストも含まれています。

30分ごとのGEMの計算方法は以下の通りです。合計MT = 48 M_T=48 /日MT=48時間間隔。各時間間隔τ \tauを取得するにはτの GEMでは、この論文では正規化された重みoit / ∑ t ∈ τ ∑ vi ∈ V oit o_{it}/ \sum_{t∈\tau} \sum_{v_i∈V}o_{it} を使用します。ああ/t τv私は Vああ30 個の GEM 値を集計し、それぞれ 1 分のタイムスタンプで計算しました。

この記事ではym ( tk ) y_m(t_k)を使用します。yメートル( t)は、 xm ( tk ) x_m(t_k)で集計された GEM 値を表します。バツメートル( t)は、m 日目の k 番目の時間間隔におけるすべてのドライバーの合計需要と合計供給時間を含む、予測子の 2×1 ベクトルを表します。am ( tk ) = 1 a_m(t_k)=1あるメートル( t)=1 は新しい戦略を使用することを意味し、それ以外の場合は- 1 -1−1 . _ GEM に対する戦略の限界的な影響を調べるために、この論文では次の回帰モデルを検討します:
ym ( tk ) = β 0 ( tk ) + β 1 ( tk ) T { xm ( tk ) − x ˉ ( tk ) } + β 2 ( tk ) am ( tk ) + η m ( tk ) + ε m ( tk ) y_m(t_k) = β_0(t_k) + β_1(t_k)^T \{x_m(t_k) − \bar{x}( t_k)\} + β_2(t_k)a_m(t_k) + η_m(_tk) + ε_m(t_k)yメートル( t)=b0( t)+b1( t)T { xメートル( t)バツˉ (t)}+b2( t_メートル( t)+メートル(k )+eメートル( t)

份位,β ( tk ) = ( β 0 ( tk ) , β 1 ( tk ) T , β 2 ( tk ) ) T β(t_k) = (β_0(t_k), β_1(t_k)^T,β_2(t_k) ))^Tb ( t)=( b0( tb1( t)b2( t) )Ttk t_ktx ˉ ( tk )における回帰係数ベクトル\bar{x}(t_k)バツˉ (t)k = 1 , . . . , MT k = 1,...,M_Tk=1 ... MTすべてxi ( tk ) x_i(t_k)バツ私は( t)サンプル平均。さらに、この記事では、η m = (η m ( t 1 ) , . . , η m ( t MT ) ) T η_m = (η_m(t_1),...,η_m(t_{M_T})) と仮定します。 ^Tメートル=( hメートル( t1... メートル( tMT) )Tε m = ( ε m ( t 1 ) , . . , ε m ( t MT ) ) T ε_m = (ε_m(t_1),...,ε_m(t_{M_T}))^Teメートル=( eメートル( t1... eメートル( tMT) )TMT×1 M_T×1MT×ランダム誤差ベクトル1 は、独立した多変量ガウス分布N ( 0 , Σ η ) N(0, Σ_η)N ( 0 ,Sh)N ( 0 , σ ε 2 ⋅ IMT ) N(0 , σ^2_ε\cdot I_{M_T})N ( 0 ,pe2MT)、そのうちS は S_niShMT×MT M_T×M_TですMT×MT行列、σ e 2 σ^2_εpe2は正のスケールです。この記事では、次の帰無仮説と対立仮説を検証します:
H 0 : ∫ 0 MT β 2 ( t ) dt = 0 v . s . H 1 : ∫ 0 MT β 2 ( t ) dt ≠ 0 H_0:∫^{M_T } _0 β_2(t)dt=0 vs H1 : ∫^{M_T}_0 β_2(t)dt\neq0H0:0MTb2( t ) d t=0v _ s H1 _:0MTb2( t ) d t=0

ただし、∫ 0 MT β 2 ( t ) dt ≈ ∑ k = 1 MT β 2 ( tk ) Δ t 0 ∫^{M_T}_0 β_2(t)dt≈ ∑^{M_T}_{k=1} β_2( t_k)Δt_00MTb2( t ) d tk = 1MTb2( t) Δt _0は 1 日あたりの平均治療効果を表します。ここで、Δt 0 Δt_0Δt _0各時間間隔の長さです。この論文では、特定の収束基準に達するまですべての未知のパラメータを反復的に推定する、一般化推定方程式 (GEE) に基づく統合推定手順を提案します。次に、 1 日あたりの平均治療効果に関連するttを計算します。t検定統計量とそれに対応する片側 (または両側)ppp値。

さらに、この論文では、上記の回帰モデルで、注文応答率、注文完了率、総商品価値 (GMV) を含む 3 つのグローバル運用指標をym ( tk ) y_m(t_k)として考慮します。yメートル( tこの論文では、対応する 3 つの回帰モデルを当てはめて、新しい配車戦略が配車プラットフォームを運用レベルで大幅に改善するかどうかを調査します。

以下の表は、実験計画 A/A と A/B の両方の回帰分析結果をまとめたものです。A/B 実験計画では、古い戦略を新しい戦略に置き換えると、平均応答率、完了率、商品の総価値が明らかに増加していることがわかります。これは、すべての pp が平均値に関連しているためです。治療効果p値はすべて1 0 − 3 10^{-3}未満です。1 0−3 . _ 新しい戦略により、GEM 価値が大幅に減少する可能性もあります (ppp値は 0.05 未満です)。これは、GEM が需要と供給を適切に定量化し、その後調査したプラットフォームの指標に影響を与えることができるという私たちの仮説と一致しています。対照的に、A/A 実験計画では、4 つの指標すべてが 5% の有意水準で有意な治療効果を示さなかった。

A/A および A/B 実験の相対的な改善率と平均治療効果の両側 p 値

以下のグラフ (A) は、2018 年 12 月 3 日の A/B 実験計画における合計 48 の 30 分の時間ウィンドウの GEM 値を示しています。朝7:00から8:00までの時間帯において、対照群戦略から実験群戦略に変更すると、GEM値が大幅に減少した。次の図 (B) は、対照グループと実験グループのそれぞれにおける同じ期間におけるスケジューリング戦略のDS dit DSd_{it}を示しています。D S dのヒートマップ。緑と紫の円でマークされた 3 つの選択されたエリアの顧客の需要は、近くのエリアのドライバーによって満たされ、その結果、需要と供給の整合性が高まり、GEM 値が小さくなります。

(A) ランダムに選択した日 (2018/12/08) の 30 分以内の都市 H の GEM 値 (B) 対照群 (7:00 - 7:30) と実験群 (7:00 - 7:30) 以内都市Hの30分:30~8:00)需給ギャップのヒートマップ

4. まとめ

一般に、この文書の主な貢献は次のように要約されます。

  1. グラフベースの動的需要供給ネットワーク平衡測定法(GEM)を提案します。これは、重み付きグラフ構造上の動的需要ネットワークと供給ネットワーク間の距離を定量化するための制限された一般化Wasserstein距離とみなすことができます。従来の方法と比較して、GEM はグラフのトポロジ構造を考慮するだけでなく全体の需要と供給の不均衡も考慮します。
  2. 各ノードの物理領域サイズを変更することにより、マルチレベル GEM とそれに対応する最適なスケジューリング戦略を取得できます。GEM は、最も細かい空間スケールで、多くのローカルな詳細を組み込んだ需要と供給の割り当てスケジューリング戦略を計算できます。対照的に、最適伝達関数の低周波数モードを比較的粗い空間スケールで大まかに表現します。
  3. 数値計算手法に関しては、GEM の計算は標準的な線形計画法 (LP) 問題として再構築できます。著者は、GEM を計算するための LP アルゴリズムの収束、GEM の期待などを含む、GEM のいくつかの理論的特性を理論的に研究しています。また、決定変数の複雑さは、LP の二重性によって大幅に軽減されます。
  4. GEM を滴滴出行のデータセットに適用すると、応答率の予測や注文配送戦略の策定などの問題が解決され、非常に良い結果が得られます。

参考文献

[1] Zhou, F.、Luo, S.、Qie, X.、Ye, J.、および Zhu, H. (2021)。配車プラットフォームへのアプリケーションを備えた動的な需要と供給システムのためのグラフベースの平衡指標。アメリカ統計協会ジャーナル、116(536)、1688-1699。
[2] アレックス・チン、トニー・チン。(2023.02.25)。ライドシェアリング市場における効率の定量化。リンク: https://eng.lyft.com/quantifying-efficiency-in-ridesharing-marketplaces-affd53043db2

おすすめ

転載: blog.csdn.net/weixin_53463894/article/details/130903936