地统计之数据分布探索

昨天讲了对数据预处理的一个最简单的方法,利用数据分级进行异常值查询,这只是数据探索的第一步,而实际地统计分析前期数据的探索光去除异常值远远不够,还需要对数据的分布进行检查,探索全局异常值和局部异常值,了解全局趋势和局部变化,进而检查空间自相关(这一步对于克里金插值方法的选择至关重要)。今天我们的专题就是对定量数据分布探索。

Tips:不是所有的插值方法都要求数据服从正态分布,但以下方法要求数据必须服从正态分布,普通克里金、简单克里金和泛克里金法创建分位数图和概率图,如果数据本身不是正态分布,想要使用上述方法,必须通过某种变换使数据服从正态分布。直方图和正态QQ图可帮助检查数据是否服从正态变换。

步骤:地统计分析工具条→探索数据→直方图或正态图
在这里插入图片描述
由上图可以看出直方图由两部分内容组成,频率分布和汇总统计数据。频率分布为条形图显示的内容,用来显示观察值位于特定区间或组之内的频率。汇总统计数据的内容:平均值:数据的算数平均值;标准差:用来表征离散度,值越小,说明数据聚类相对于均值越紧密;偏度:用来表征分布对称度的测量值。对于对称的分布,偏度系数为零。如果分布具有较长的大值右尾部,则为正偏分布;如果分布具有较长的小值左尾部,则为负偏分布。对于正偏分布,平均值大于中间值;对负偏分布,平均值小于中间值。下图显示了一个正偏分布;峰度:用于表征分布尾部的大小,正态分布的峰度等于三。具有较厚尾部的分布被称为高峰态,其峰度大于三。具有较薄尾部的分布被称为低峰态,其峰度值小于三;1/4分位数:升序排列,位于中位数之下,第一分位数之上;中位数:与累积比例0.5对应;3/4分位数:升序排列,位于中位数之上。

如果数据不服从正态分布,可通过变换方式对数据进行变换。

QQ图检查数据分布
在这里插入图片描述
正态 QQ 图上的点可用来指示单变量数据分布的正态性,如果是正态分布,点将落在 45 度参考线上,如果数据不是正态分布,点将会偏离参考线。

想要了解更多知识,获得干货,关注微信公众号:GIS点滴

发布了33 篇原创文章 · 获赞 24 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/qq_39826117/article/details/104867929