内挿、定常仮説、固有仮説、バリオグラム、アバットメント、ナゲット、クリギング、線形不偏最適...地球科学計算の主な概念と式の完全な解

内挿、定常仮説、固有仮説、バリオグラム、アバットメント、ナゲット、クリギング、線形不偏最適...地球科学計算の主な概念と式の完全な解

1はじめに

マルチスペクトルおよびハイパースペクトルリモートセンシングの実用的なアプリケーション  から始まった最近のいくつかのブログでは、それぞれ前処理と関連するアルゴリズム、および画像の反転操作が詳細に紹介されています。リモートセンシングを通じてさまざまな種類の表面情報データを豊富に取得した後、データの優れた数学的処理と科学的分析をどのように実行するかについても注意を払う必要があります。したがって、私はこのブログから始めて、地球科学計算の内容の予備的な要約を1つずつ与えるために新しい列を作成します。
  そこでまず、地球科学コンピューティングのいくつかの基本的な概念から始めて、関連する理論的内容をある程度理解します。
  なお、以下の内容は、個別に見ると少しわかりにくいかもしれませんが、実際のアプリケーションと組み合わせると、いきなり明らかになります。その中で、私が次のブログでカバーする特定の実用的なアプリケーションの部分。

2空間補間

  空間データの取得は、空間分析の基礎と起源です。研究の結論の精度を向上させるために、私たちは常に、研究領域でますます包括的で正確な空間属性データ情報を取得することを望んでいます。しかし、実際の研究や作業では、人的資源、コスト、リソースなどの外部の制約により、すべての未知の領域をサンプリングして測定することは不可能ですが、多くの場合、限られた数のサンプリングポイントと関連する属性データのみが研究領域を取得することができます。したがって、特定の数学モデルを使用して適切な空間サンプリングポイントを選択し、既知のサンプリングポイントの対応する属性データに基づいて、調査領域内のすべての場所の未知の属性情報を予測することを検討できることがよくあります。
  空間補間はこの要件を達成できます。離散サンプリングポイントの測定データを、内挿と外挿の2つのアプリケーション形式を含む連続データサーフェスに変換するのが一般的な方法です。一般に、サンプルポイントの範囲内のスペース(つまり、すべてのサンプルポイントの最大の外接長方形の内側)は「補間」と呼ばれます(一部のドキュメントでは、「補間」ではなく「補間」を直接使用します)。逆もまた同様です。「外挿」または「予測」は、外挿の結果に大きな誤差があると見なされることがよくあります。
  空間補間理論とその方法は、有名な「地理学の第一法則」に基づいています。つまり、一般に、距離が近いほど相関が高くなります。広範囲にわたる影響を及ぼしたこの地質法は、1970年にアメリカのスイスの地理学者であるWaldo R.Tobler教授によって最初に提案されました。
  各方法に対応する数学的計算原理のレベルでは、空間内挿は一般に決定論的内挿法(決定論的内挿)と地球統計学的内挿法(地球統計学、非決定論的内挿法としても知られています)に分けることができます。その中で、決定論的内挿法は、調査領域内の情報点間の類似性または表面全体の滑らかさに基づいて、連続的な適合面を作成します。さらに、全体内挿法と局所内挿法に分けることができます。地球統計学的内挿法は、変動関数(バリオグラム)の理論と構造解析に基づいて、研究領域内の各情報ポイントの包括的な統計法則に基づいており、その属性の空間的自己相関の定量化を実現し、それによって連続を作成します補間面。
  作成された連続補間面がすべてのサンプリングポイントを通過するかどうかのレベルで、空間補間は一般に、精密補間と非精密補間の2つのタイプに分けることができます。その中で、前者の予測サンプルの属性値はそれぞれの実際の測定値に等しい、つまり、サンプリングポイントのすべての属性データは予測結果サーフェスに分類されます;後者の予測サンプルの属性値多くの場合、それぞれの実際の測定値と等しくありません。つまり、サンプリングポイントの属性データは通常、予測結果の表面に分類されません。したがって、不正確な内挿法を使用すると、予測面に明らかな山や谷が現れるのを回避できることが多く、全体的な傾向は穏やかです。

3いくつかの重要な仮定

  地球科学の計算では、いくつかの重要な仮定が鍵の鍵であると言えますが、それらは理解するのが難しいことがよくあります。恐れることなく、ゆっくりと見下ろしてみましょう。

3.1定常仮説

  定常仮定(定常仮定)とは、一連の観測値の平均値が常に固定されており、観測値の場所とは関係がないことを意味します。確立された一連のポイントが研究領域のある場所から別の場所に移動された場合。 、ランダム関数の性質は変わりません。つまり、ランダム関数の分布則は、位置の変化によって変化せず、厳密な安定性を持っています。
定常性仮説の式は次のように表されます。
ここに画像の説明を挿入
  ここで、F_(x_1、...、x_n)(z_1、...、z_n)は、(にある点集合(z_1、...、z_n)に対応するランダム関数を表します。 x_1、...、x_n)。

3.2二次定常性の仮定

  弱い定常仮定としても知られる第2定常仮定(第2定常仮定)は、共分散関数に関連しています。この仮説は、確率関数の平均は定数であり、任意の2つの確率変数間の共分散は、それらの間の距離と方向にのみ依存し、それらの特定の位置とは関係がないというものです。
  上記の2つの条件は、次の式で表されます。
ここに画像の説明を挿入
  その中で、E [Z(x)]は地域化変数Z(x)の数学的な期待値であり、Cov [Z(x)、Z(x + h)]は地域化された変数Z(x)およびZ(x + h)に対応する共分散関数。C(h)はhにのみ関連する共分散の値であり、mは定数、hはラグです。
  上記の2次定常性仮説は、調査領域全体を対象としています。地域化された変数が研究領域全体の限られた領域でのみ上記の条件を満たす場合、つまり、条件がローカル領域でのみ有効である場合、地域化された変数は準第2定常仮定を満たしていると言われます。準2次定常性の仮説は、定常範囲のサイズと有効なデータの数の両方を考慮した妥協案と見なすことができます。

3.3本質的な仮説

  内因性仮説としても知られる内因性仮説は、バリオグラムに関連しています。この仮説は、地域化された変数の増分が次の2つの条件を満たすと考えています。研究領域全体で、地域化された変数の増分の数学的期待値は0であり、その分散関数は存在し、ラグにのみ依存します。場所は関係ありません。
  上記の2つの条件は、次の式で表されます
ここに画像の説明を挿入
  。E(x)が存在する場合、上記の最初の式は次のように記述できます。
ここに画像の説明を挿入
  その中で、Var [Z(x)-Z(x + h)]は地域化変数Z( x)はZ(x + h)に対応する分散関数、γ(h)はラグ距離がh、mが定数、hがラグ距離、その他のシンボルが次の場合の地域化変数の変動関数です。上記と同じ意味です。
  同様に、上記の固有の仮説も研究領域全体に当てはまります。地域化された変数が研究領域全体の限られた領域でのみ上記の条件を満たす場合、地域化された変数は準内因性仮説(準内因性仮説)を満たしていると言われます。準2次定常性仮説と同様に、準固有仮説も妥協案と見なすことができます。これは、固有仮説の対応する範囲のサイズと有効なデータの数も考慮に入れます。
  さらに、固有の仮説は、地球統計学におけるランダム関数の基本的な仮説です。

3.4さまざまな仮説の比較

  上記の2次定常性仮説と固有仮説の関連する原理を組み合わせると、2つの仮説の議論対象には一定の違いがあることがわかります。2次定常性仮説は、地域化された変数を議論するためのものです。特定の研究領域[すなわちZ(x)]であり、本質的な仮説は、地域化変数に対応する増分[すなわちZ(x)-Z(x + h)]の特性を研究することです。
  一般に、2次定常性仮説は、固有の仮定よりも地域化変数の要件が厳しいと考えられています。つまり、研究領域内の特定の地域化変数が2次定常性仮説を満たす場合、固有の仮説を満たす必要があります。 、地域化変数のみが固有の仮説を満たすことがわかっている場合、それは必ずしも2次定常性仮説を満たすとは限りません。
  定常仮説と組み合わせると、上記の3つの仮説の厳密性は、定常仮説、2次定常仮説、および固有仮説の降順で並べられます。
  さらに、2次定常性仮説の2つの条件を組み合わせることで、共分散関数とバリオグラムの関係を導き出すことができます。
ここに画像の説明を挿入
  その中で、γ(h)は地域化変数に対応するバリオグラムであり、C(0)は距離0この地域化された変数に対応する共分散の値が[すなわちシル値γ(∞)]の場合、C(h)は距離がhのときのこの地域化された変数の対応する共分散の値です。
  この関係から、共分散関数とバリオグラム(hで区切られた2つの空間位置で特定の地域化された変数の自己相関を測定するために使用されるインデックス)の間に相関があることがわかります。したがって、二次定常性仮説を満たす条件の下で、共分散関数が安定している場合、変動関数は安定している、つまりその値はラグ距離hにのみ関係していることがわかります。

4変分関数

  クリギング内挿法は、空間データの実験的バリオグラムとその散布図特性に依存する必要があるため、バリオグラムの計算はクリギング内挿プロセスで重要な役割を果たします。バリオグラムとそのモデルフィッティングは、クリギング内挿結果で重要な役割を果たします。精度はより大きな影響を及ぼします。
  セミバリオグラム、セミバリオグラムなどとしても知られるバリオグラムは、地域化された変数の空間変化特性と強度を説明するために使用され、地域化された変数の増分の2乗の数学的期待値として定義されます。
  1次元の条件下で、位置(x)と(x + h)での地域化変数Zの値Z(x)とZ(x + h)の差の分散をバリオグラムとして直接定義します。従属変数は距離hであり、2次元または3次元の条件下では、上記の一次元の単一方向の距離hは、任意の方向αの距離| h |までさらに拡張できます。具体的な式は次のように表されます。
ここに画像の説明を挿入
  その中で、γ(x、h)は変動関数です。式の前に係数「2」があるため、セミバリオグラムとも呼ばれます。(準)2次定常性仮説や(準)固有仮説などの基本的な地質学的仮定と組み合わせると、変動関数の値は、地域化された変数のサンプルポイントの位置xとは関係ありませんが、サンプルポイント間の距離hの場合、変動関数は次のように記述できます。
ここに画像の説明を挿入
  ここで、〖γ(h)〗^#は地域化変数Z(x)の変動関数、N(h)はポイントペアの数です。地域化された変数のサンプルポイントの距離hで、x_iは距離hです。時間に対応するi番目のポイント。ここで、距離hはラグ距離(ラグ距離)とも呼ばれる
  一般に、地域化された可変バリオグラムの画像は、「最初に急速に上昇し、次に減速し、次に安定する傾向がある」という特徴的な曲線を示すことがよくあります。これには、3つの非常に重要な関連概念があります。つまり、ナゲット定数(Nugget)、シル(Sill)、および可変範囲(Range)です。
  ナゲット定数地域化変数のランダム性を表します。理論的な観点から、間隔が0の場合(つまり、ラグ距離がゼロの場合)、地域化された変数のサンプリングポイントの値は等しくなります。間隔が0に無限に近い場合、の値は対応するバリオグラムも0に近いはずです。ただし、実際の研究では、検定変動関数のラグ距離が0の場合、その値は0ではなく、0より大きい値になります。この値はナゲット定数と呼ばれます。一般に、上記のナゲット効果は、測定誤差、またはサンプリング間隔の距離よりも小さい空間変動に起因する可能性があります。
  敷居値は、地域化変数の変化の大きさを測定するために使用されます。ラグ距離が無期限に増加し、ある程度に達すると、テスト変動関数が安定する傾向がある場合、この安定したレベルに対応する値が基地局の値になります。ただし、すべての地域化された変数にシル値があるわけではありません。たとえば、シル値のないモデルに対応するバリオグラムなどです。
  変数範囲は、地域化された変数の自己相関範囲のサイズを測定するために使用されます。ラグ距離が無期限に増加してある程度に達したとき、テスト変動関数が安定する傾向がある場合、この時点での対応するラグ距離は可変範囲です。ここで、可変範囲よりも小さい距離に対応するサンプル位置は空間と自己相関し、可変範囲よりも大きい距離に対応するサンプル位置は空間的自己相関を持たない。
  また、バリオグラムは、差のような他の関連指標有する敷居値とナゲット定数-部分シル、敷居にナゲット定数の比である付加価値空間variability-の程度を測定するために使用されます-ナゲット係数など。
  さまざまな地域化された変数に対応するバリオグラムの特性に基づいて、それらはさまざまなカテゴリに分類できます。変動関数の敷居値の有無に応じて、モデルは敷居値モデル非橋台値モデル、およびキャビテーション効果モデルに分けることができます
  その中には、基地局価値モデルがありますバリオグラムの特性に応じて、純粋なナゲット効果モデル(純粋なナゲット効果モデル)、球形モデル(球形モデル)、指数モデル(指数モデル)、ガウスモデル(キュービックモデルまたはガウスモデル)、線形にさらに分類できます。アバットメントモデル(シルモデルと線形)など。上記のモデルの中で、より一般的に使用されるモデルには、球形モデル、指数モデル、およびガウスモデルが含まれます。
  さらに、バリオグラムの特性に基づいて、非基地局値モデルは、線形非基地局値モデル、電力指数モデル、および対数モデルにさらに分割することができます。同様に、キャビテーション効果モデルは、アバットメント値モデルとアバットメント値モデルなしに分けることができます。
  同時に、特定の地域化された変数については、さまざまな方向のさまざまな要因とさまざまなラグ距離の影響を受ける可能性があります。ネストされた構造は、この問題をうまく解決できます。ネストされた構造は、複数のバリオグラムの合計として表すことができます。各バリオグラムは、地域化された変数の特性をより一般化するために、特定の方向または特定のスケールでの変動を表します。

5クリギング補間

  空間局所補間としても知られるクリギング法(クリギング法)は、上記のバリオグラム理論とその構造解析に基づいており、限られた領域の地域化変数の線形不偏最適推定を実行します(最良線形不偏予測)。、BLUP )は、地理統計学では空間最適偏り推定量(Spatial BLUP)としても知られています。
その中で、上記の「線形」は、線形推定を使用して未知の点の属性値を推定するクリギング補間法を指します。式は次のとおりです。
ここに画像の説明を挿入
  ここで、(z_0)̂は点での地域化変数の予測値です( x_0、y_0)、Λ_iはi番目の既知の点の重み係数であり、z_iはi番目の既知の点の測定値です。
  上記の重みλ_iは、各ポイントでの予測値と測定値の間の分散を最小限に抑えることができ、この重みを取得することがクリギング補間の主な内容です。
  上記の「不偏」とは、地域化された変数の各点での推定量の数学的期待値が同じ位置での真の値に等しいことを意味します。式は次のとおりです。
ここに画像の説明を挿入
  固有の仮定と組み合わせると、不偏性を表すことができます。として:
ここに画像の説明を挿入
  上記の「最適」とは、各点での地域化変数の推定量と同じ位置でのその真の値との間の最小の分散を指します。式は次のとおりです。
ここに画像の説明を挿入
  その中で、上記の分散は次のとおりです。推定分散または推定分散と呼ばれ、推定の精度の定量的表現です。クリギング補間法では、クリギング分散とも呼ばれます。クリギングの分散は、後でσ_k^ 2として記録されます。
  統計関連の導出後、クリギング分散は次のように記述できます。
ここに画像の説明を挿入
  これ、不偏条件の制約の下で最小値の問題に変換できますラグランジュ乗数φを導入して、ラグランジュ関数を作成します。
ここに画像の説明を挿入
  重みとラグランジュ乗数の1
ここに画像の説明を挿入
  階偏微分を求めます。微分解の結果は次のとおりです。
ここに画像の説明を挿入
  上記の合計部分を展開します
ここに画像の説明を挿入
  。上記の式は、行列乗算の形式でさらに記述でき、次のように変換されます。
ここに画像の説明を挿入
  これらの中で、Aは、元のバリオグラム行列への1行すべてと1列すべての追加を表します(ジャンクション1は後者の行列、λは各重みで構成される列ベクトル、φは前の分析で導入されたラグランジュ乗数、Bは各位置と位置の間の距離に対応するバリオグラム値で構成される列ベクトルです。解決する必要があり、列A1の最後に追加されます。
  したがって、上記の関数は、(n + 1)個の未知数と(n + 1)個の式で構成される連立方程式に変換されます。行列の反転により、連立方程式を解いて、解くべき位置やその他の既知の位置の重みを取得できます。ポイント。。挿入する各ポイントに対して同じ操作を実行して、クリギング補間を完了します。

6クリーガーに戻る

  上記の分析と同様に、通常のクリギング法は、選択されたサンプリングポイントのデータに依存して空間を補間します。その補間効果は、サンプリングポイントの数と密度、およびデータの精度に大きく依存します。 、、多くの空間属性は、他の環境変数の影響を受けることがよくあります。たとえば、土壌の有機炭素含有量は、気温、標高、降水量、0.05レベルの傾斜などのさまざまな環境要因と有意に相関しています[3、4]。地表近くの温度は、標高、陸地などの環境要因と有意に相関しています。海上距離、および0.01レベルのNDVI [3、4] 5]。この観点から、補間の空間属性に対する環境要因の影響を単に無視すると、最終的な補間結果の精度が低下する可能性があります。
  この考慮事項に基づいて、回帰クリギング法を使用して環境要因を考慮することができます。回帰クリギング補間を適用するには、最初にターゲット変数と補助環境変数の間の相関を決定する必要があります。相関が要件を満たしていることを確認した後、ターゲット変数と環境変数の単変量または重回帰モデルを確立して排除します。空間トレンドアイテム。続いて、サンプリングポイントの測定データと回帰モデルによって計算された対応する位置値に従って、ターゲット変数の決定論的傾向項目が取得されます。通常のクリギング法を用いて残差を内挿し、最後に回帰予測のトレンド項目を通常のクリギングの内挿結果に加算して、対象変数の推定値を求めます。
  最終的な空間補間結果の式は、次のように表されます。
ここに画像の説明を挿入

  その中で、Z(x_0)は位置x_0での回帰クリギング推定の結果です。m̂(x_0)はこの位置での決定論的傾向項の値です。ē(x_0)は残差の通常のクリギング補間です。ポジション。調査領域の各位置に対して同じ操作を実行して、回帰クリギング補間を完了します。
  一般に、外界の影響を大きく受ける空間属性の場合、回帰クリギング補間の効果は、通常のクリギング補間の効果よりも優れています[6]。
  一方、前述のように、回帰クリギング法は、残余項の計算に通常のクリギング補間を使用しますが、環境要因によって決定される空間よりも、最終的なターゲット変数の補間結果に大きな影響を与えます。性的傾向の項は次のとおりです。まだ低いので、回帰クリギング法の結果は、通常のクリギング法の結果と比較して粗く壊れます。さらに、この方法で考慮される要因の観点から、回帰クリギング法とコクリギング法には一定の類似点があります。つまり、どちらも関連する環境要因を使用してターゲット変数の空間分布を推定します。違いは、補助変数が回帰クリギングのデータはラスターレイヤーなどの領域に分散されますが、コクリギングの補助データはポイントに分散されます。ただし、どの方法を採用しても、最終的な補間結果は完全なサーフェスになります。

パブリックアカウントに注意を払うことを歓迎します:クレイジーラーニングGIS

ここに画像の説明を挿入

おすすめ

転載: blog.csdn.net/zhebushibiaoshifu/article/details/113943720