半方差函数详解

1 引言

托布勒的地理第一定律指出，“一切都与其他事物有关，但近处的事物比远处的事物更相关。

在半变异函数的情况下，更接近的事物更可预测，变异性更小，而遥远的事物则难以预测，相关性也较低。

例如，当前位置的地形更可能与前方 1 米处的地形相似，而不是与 100 米外的地形相似。

半变异函数绘制了样本值（污染、海拔、噪声等）如何随距离变化。

接下来以土壤水分样本作为案例进行说明。

案例包含 10 英亩田地中的 73 个土壤水分样本。在西北角，样品更湿润，含水量更高。但在东部象限，它们要干燥得多，如下图所示。

针对上图存在以下疑问：

不同地点的值的可预测性如何？
距离较近的已知值是否比距离较远的值更相似？

可以用统计依赖性或自相关来描述这个想法。此外，空间自相关（距离较近的事物比距离较远的事物更相似）为预测提供了有价值的信息。

2 半变异函数原理

要了解空间依赖性，可以使用半变异函数进行估计。半变异函数取 2 个采样位置，并将两点之间的距离称为 h。

在 x 轴上，它以滞后为单位绘制距离（h），滞后只是分组距离。取每组 2 个样本位置，测量响应变量（土壤中的含水量）之间的方差，并将其绘制在 y 轴上。

根据观察者的不同，半变异函数看起来像是一大堆点。例如，土壤水分图如下所示：

但是可以通过选择单个点来做一些侦探工作。当在半变异函数上取这个点时：

可以在地图上看到它们代表哪 2 个点。这是有道理的，因为它们彼此相距很远。因此，它在半变异函数中的极右位置。下面强调的正是这一点：

它们与该特定滞后距离的平均值也存在很大差异。如果半方差较高，则它在 y 轴上的位置较高。可以看到，半方差在滞后距离越近时越小，滞后距离越大，半方差就越大。

我们正在研究 2 个样本之间的所有距离及其变异性。半变异函数考虑所有点及其与方差的距离。

这就是为什么半变异函数上有这么多点的原因。这是上面数据集的一个子集，可以看到我们可以在半变异函数中绘制的所有不同点集。

3 半变异函数计算

半方差函数是距离 h 的函数，也是方向 α 的函数。当一个变量分布于空间时，该变量叫区域化变量(regionalized variable)，半方差函数就是区域化变量 $Z(x_i)$ 和 $Z(x_i+h)$ 增量平方的数学期望，即区域化变量增量的方差(variograms)。其计算公式：

$r(h)=\frac{1}{2N(h)}\sum_{i=1}^{N(h)}[Z(x_i)-Z(x_i+h)]^2$

式中， $r (h)$ 是相隔距离为 $h$ 的半方差图的估计值， $N (h)$ 是相隔距离为 h 的所有点的配对数， $Z(x_i)$ 是样点 $x_i$ 的平均密度， $Z(x_i+h)$ 是样点 $x_i+h$ 的平均密度。

半方差图是 $r (h)$ 作为距离 $h$ 的函数的图形，其值为某一特定方向的值，其中有4个最重要的参数：

变程(RANGE):是当变异函数的值达到平衡时的间隔距离，反映了区域化变量影响范围的大小。
块金值(NUGGET):指变异函数曲线延伸到间隔距离为零时的截距，反映区域化变量内部随机性的可能程度
基台值 $C_0+C$ (SILL):是指达到平衡时的变异函数值，反映变量变化幅度的大小
空间变异比 $C_0/(C_0+C)$ :反映变量空间变异的程度，其值较高，说明随机部分引起的空间异质性程度较高；较低则说明由空间自相关部分引起的空间变异较大；如果该比值接近1，则说明该变量在整个尺度上具有恒定的变异。从结构性因素看，其表示系统变量的空间相关程度，比值小于25%，说明变量具有强烈的空间相关；比值在25%-75%，变量是中等程度的空间相关；大于75%，变量空间相关性很弱。

以 $r (h)$ 为纵轴， $h$ 为横轴，绘制出 $r (h)$ 随 $h$ 增加的变化曲线为半方差图。

从图中可以看出：

在距离较近的采样点，点之间的值差异往往很小。换言之，半方差很小。
随着远离采样点的距离增加，采样点之间不再存在关系。它们的方差开始趋于平缓，样本值彼此之间没有关联。
当同一位置有两个采样点时，可以预期具有相同的值，因此块金值应为零。有时他们不会，这增加了随机性。但在图形开始调平之前，这些值在空间上是自相关的。
当距离增加时，半方差会增加。相隔很远的点对较少，因此样本点之间的相关性较低。
正如半变异函数所示，它开始达到其平坦的渐近水平。尝试拟合函数以对此行为进行建模。

4 半方差图拟合模型

计算取样范围内所有可能距离间隔的变异函数，绘制函数曲线图，进而建立变异函数理论模型。

地统计学中常用来拟合实际变异曲线的理论模型有球状模型、指数模型、高斯模型、线状模型等。

一般情况下，球状模型说明所研究的种群呈聚集分布，表示当样本点间隔距离达到变程之前，样点的空间依赖性随样点间距离增大而降低
指数模型与球状模型相似，但其基台值是渐进线
随机分布的 $r (h)$ 不随距离变化而规律性变化
非水平线状模型表示种群为中等程度的聚集分布，其空间依赖范围超过研究尺度
完全随机或均匀的数据，曲线表现为纯块金变异图， $r (h)$ 呈水平直线或稍有斜率，表明在抽样尺度下无空间相关性

选择何种模型去拟合样本半方差图是一个复杂的过程，一般是根据样本方差图的形状或研究目的来确定。

自然界中许多生物和非生物因子的空间分布与方向有密切关系，因此，也产生了相应的各项异性模型。

有些区域化变量往往包含各种尺度或各种层次的变化，反映在半方差函数上其结构往往不是一种模型结构，而是多种模型结构相叠加在一起的套合结构。

python实现：

https://scikit-gstat.readthedocs.io/en/latest/userguide/variogram.html#the-variogram

参考：
https://gisgeography.com/semi-variogram-nugget-range-sill/

1 引言

2 半变异函数原理

3 半变异函数计算

4 半方差图拟合模型

猜你喜欢