パラメータ推定 - グリッドベースのアプローチ

序章

近似事後分布P r ( θ ∣ d ) P_r(\theta|d)Pr( θ | d )に対する最も単純な数値的アプローチは規則的なグリッドで評価された(必ずしも正規化されていない)密度値分布上の積分は単純な合計として近似され、他の標準導出量の計算は非常に簡単です。

グリッドアプローチの長所と短所

グリッドベースの手法の利点

  1. 精度/速度。評価の規則的な間隔は最小限の冗長性を意味するため、標準導出の推定誤差はサンプル サイズの増加とともに減少します。
  2. 再現性。(グリッド パラメータが固定されていると仮定するだけで、事後密度を直接推定できるため) 再計算しても結果は同じになります。
  3. 規則的なグリッドを構築するアルゴリズムは複雑ではないため、シンプルです。
  4. 正規化されていない事後値のグリッドを使用できるため、正規化の必要はありません。

グリッドベースの方法の欠点または制限

  1. 事後値が重要であるパラメータ値の範囲について、何らかの外部知識が必要です(事前の範囲で十分な場合もありますが、通常は十分ではありません)。
  2. 事後誤差がある場合、根底にある「系統的」誤差は周期的であるか、グリッド点間の間隔に応じたスケールで変化します。
  3. このアプローチは、低次元の問題にのみ適しています(パラメーターが 3 ~ 4 を超える問題は計算上実行不可能です)。
  4. 任意の次元のグリッドを処理するコードを記述するのは扱いにくい場合があります。

事後サンプル配列を生成し、それを有用な出力に処理するために必要なアルゴリズムは非常に単純で、特に多次元環境では、純粋な数式よりもはるかに単純です。アルゴリズムの観点からそれらを説明する方がはるかに自然です。ここで、バイナリ事後分布P r ( θ ∣ d ) = P r ( x , y ∣ d ) P_r(θ|d) = P_r(x,y|d)Pr( θ d )=Pr( x ,y d )、ここでN p = 2 、 θ = ( x , y ) N_p = 2、 θ = (x,y)Np=2 =( x ,y ) ; 高次元 (または低次元) の問題への一般化は概念的に簡単です。

メッシュの生成

グリッドベースの方法の場合、分布P r ( x , y ∣ d ) P_r(x,y|d)Pr( x ,y | d ) (つまり、評価する能力) は十分な出発点ではありません。考慮するパラメーター値の範囲を決定するには、いくつかの情報が必要です。xmin 、 xmax 、 ymin 、 ymax を決定できなければなりません x_{min}、x_{max}、y_{min}、および y_{max}バツ×マックス_yマックス_的值,使得 P r ( x m i n ≤ x ≤ x m a x , y m i n ≤ y ≤ y m a x ∣ d ) P_r(x_{min}≤x≤x_{max},y_{min} ≤ y ≤ y_{max}|d) Pr( ×バツバツマックス_yyyマックス_d ) ≪ \ll 1(即,由 x m i n 、 x m a x 、 y m i n 和 y m a x x_{min}、x_{max}、y_{min}和y_{max } バツ×マックス_yマックス_境界領域には、ほぼすべての確率が含まれます)。ただし、すべてではないにしても、ほとんどのグリッド ポイントが低確率領域に含まれるため、この範囲を単に任意に大きくするだけでは十分ではありませんこれを行うための一般的なアルゴリズム (サンプリング法) はありますが、これらに頼らなければならないことは、グリッドベースの手法の目的を大幅に無効にすることになります。したがって、ここではxmin 、 xmax 、 ymin 、 ymax と仮定します x_{min}、x_{max}、y_{min}、および y_{max }バツ×マックス_yマックス_の妥当な値は外部情報からわかりますが、そのような制約がすぐに利用できない場合、グリッドベースの手法はすぐに役に立たなくなる可能性があることは強調しすぎることはありません。

次に決定すべきことは、列数N c N_cによって与えられるグリッドの解像度です。Ncと行数N r N_rNr意味。この選択は、精度と速度の間のトレードオフの影響を受けます。

各次元の最小値は 10 です。実際の問題でよく遭遇する事後分布の場合は、 1 0 2 10^2より大きい値です。1 0通常、値2は不要です。製品ラインと同様に、これにもある程度の試行錯誤が必要です。

したがって、グリッドはx min ⁡ ≤ x ≤ x max ⁡ x_{\min } \leq x \leq x_{\max } をカバーします。バツ_バツバツマックス_ _y min ⁡ ≤ y ≤ y max ⁡ y_{\min } \leq y \leq y_{\max }y_yyマックス_ _N c × N r N_{\mathrm{c}} \times N_{\mathrm{r}}の範囲Nc×Nr面積はΔ x × Δ y \Delta x \times \Delta yです。Δx_ _×Δ yの cell 配列。ここで、 Δ x = ( x max ⁡ − x min ⁡ ) / 2 \Delta x=\left(x_{\max }-x_{\min }\right) / 2Δx_ _=( ×マックス_ _バツ_)/2 ,Δ y = ( y max ⁡ − y min ⁡ ) / 2 \Delta y=\left(y_{\max }-y_{\min }\right) / 2y_ _=( yマックス_ _y_)/2この時点から、以下に指定されたアルゴリズムに従います。

1. 各列の組み合わせについて、c ( ∈ { 1 , 2 , … , N c } ) c\left(\in\left\{1,2, \ldots, N_{\mathrm{c}}\right\ } \右)c( { 1 2 Nc} )と行の組み合わせr ( ∈ { 1 , 2 , … , N r } ) r\left(\in\left\{1,2, \ldots, N_{\mathrm{r}}\right\}\右)r( { 1 2 Nr} )計算するには、

( xc , yr ) = [ x min ⁡ + c − 1 / 2 N c ( x max ⁡ − x min ⁡ ) , y min ⁡ + r − 1 / 2 N r ( y max ⁡ − y min ⁡ ) ] , \left(x_{c}, y_{r}\right)=\left[x_{\min }+\frac{c-1 / 2}{N_{\mathrm{c}}}\left(x_{\ max }-x_{\min }\right), y_{\min }+\frac{r-1 / 2}{N_{\mathrm{r}}}\left(y_{\max }-y_{\min }\そうそう]、( ×cyr)=[ ×_+Ncc 1/2( ×マックス_ _バツ_)y_+Nrr 1/2( yマックス_ _y_) ]

ここで、各グリッド セルの中央にある点が選択されます。

  1. 配列内の各要素について、正規化されていない事後確率を計算します。

pc , r ' = Pr ⁡ ( x , y ) Pr ⁡ ( d ∣ x , y ) 。p_{c, r}^{\prime}=\operatorname{Pr}(x, y) \operatorname{Pr}(\boldsymbol{d} \mid x, y) 。pc r=Pr ( x ,y PRd)× y )

3. 計算による事後サンプルの数値正規化

pc 、r = pc 、r ' ∑ c = 1 N c ∑ r = 1 N rpc 、r ' 。p_{c, r}=\frac{p_{c, r}^{\prime}}{\sum_{c=1}^{N_{\mathrm{c}}} \sum_{r=1}^{ N_{\mathrm{r}}} p_{c, r}^{\prime}} 。pc r=c = 1Ncr = 1Nrpc rpc r

このステップは不要な場合もありますが、数値的には安価で、その後の分析が簡素化されます。

事後確率の区分的定数近似は、次のようにして提供されます。

Pr ⁡ ( x , y ∣ d ) ≃ 1 ( x max ⁡ − x min ⁡ ) ( y max ⁡ − y min ⁡ ) ∑ c = 1 N c ∑ r = 1 N r Θ [ x − ( xc − Δ x / 2 ) ] Θ [ ( xc + Δ x / 2 ) − x ] Θ [ y − ( yc − Δ y / 2 ) ] Θ [ ( yc + Δ y / 2 ) − y ] pc , r , \begin{ array}{c} \operatorname{Pr}(x, y \mid \boldsymbol{d}) \simeq \frac{1}{\left(x_{\max }-x_{\min }\right)\left( y_{\max }-y_{\min }\right)} \sum_{c=1}^{N_{\mathrm{c}}} \sum_{r=1}^{N_{\mathrm{r}} }\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad \\ \Theta\left[x-\left(x_{c}-\Delta x / 2\right) \right] \Theta\left[\left(x_{c}+\Delta x / 2\right)-x\right] \Theta\left[y-\left(y_{c}-\Delta y / 2\ right)\right] \Theta\left[\left(y_{c}+\Delta y / 2\right)-y\right] p_{c, r}\qquad\qquad\qquad, \end{array}Pr ( x ,yd )( ×マックス_ _×_) ( yマックス_ _y_)1c = 1Ncr = 1NrTh[ ×( ×cΔ x /2 ) ]Th[ ( xc+Δ x /2 )× ]Th[ y( ycy / 2 ) ]Th[ ( yc+y / 2 )y ]pc r

グリッドでカバーされる領域の外側はゼロです。より複雑な内挿スキームを使用して、 pc , r {p_{c,r}}から取得することもできます。pc rすべての x と y に対して定義された分布に従うことになりますが、重要なのは、連続関数P r ( xc , yr ∣ d ) P_r(x_c,y_r|d) であるということです。Pr( ×cyrd )は、有限の数値集合pc 、 r {p_{c,r}}pc r真ん中。

参考文献

https://docslib.org/doc/8720468/parameter-estimation-daniel-mortlock-mortlock-ic-ac-uk-last-modi-ed-september-12-2013

フェローズ、F.、ホブソン、MP、ブリッジズ、M. (2009)。MULTINEST: 宇宙論と素粒子物理学のための効率的で堅牢なベイズ推論ツール。王立天文学協会の月刊通知、398、1601 ~ 1614 年。

ゲルマン、A. およびルービン、DB (1992)。複数のシーケンスを使用した反復シミュレーションからの推論。統計科学、7、457–511。

スキリング、J. (2004)。ネストされたサンプリング。AIP Conference Proceedings of the 24th International Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering、Lecture Notes in Physics、volume 735、Berlin Springer Verlag、395 ~ 405 ページ。

おすすめ

転載: blog.csdn.net/weixin_48266700/article/details/128807748
おすすめ