空间相互作用数据挖掘及可视化分析相关文章综述

  1. 祝曦在“海量空间相互作用数据挖掘及可视化”中提出了
  • 一种从大规模空间相互作用数据中提炼地理特征信息的方法,主要步骤包括:将空间点聚合成类,计算统计量度,然后可视化统计量度来发现时空模式。文中将该方法作用在一组出租车数据上,这一组出租车数据描述中国深圳市的 2331 辆出租车五天内的轨迹。实验在出租车数据上发现了各种时空模式,例如,不同时段的流量差等。方法主要解决的问题有:(1)如何识别大量空间点的自然边界,(2)如何综合移动数据,从而得到高层次的信息,(3)如何有效的处理大规模空间点数据并有效的发现规律。
  • 一种将大量空间相互作用数据聚类的方法。该方法主要的思想是扩展传统的空间点层次聚类方法,应用到空间相互作用数据。文章通过使用深圳出租车数据,对出租车的时空模式进行了分析。研究主要解决的问题有:(1)使用层次聚类方法,对空间相互作用数据进行聚类;(2)定义空间相互作用数据的相邻关系;(3)提出了一种基于点密度分布的空间相互作用的相似性量度(4)在空间聚类的结果上,对数据的时间模式进行了分析。
  • 空间相互作用数据核密度估计模型。该模型的主要思想是,将点的核密度估计模型扩展到空间相互作用数据。该算法主要分为三个步骤:空间相互作用数据的核密度估计,代表性数据选择,流向地图可视化。该算法主要解决的问题有:(1)从大量的空间相互作用数据中提取出固有的模式规律(2)通过核密度估计模型,归一化起点和终点区域大小,解决了 MAUP 问题和小单元区域问题。文中使用美国移民数据集,这组数据来源于 2000 年的人口普查。这次人口普查询问了人们五年前的居住位置,和现在的居住位置。这组数据包含了 5 年内(2000-2005)人口的移动信息。案例代表性数据选择算法选取 200 条移民差流数据。用蓝色代表移出的人口比移入的人口多,用红色代表人口移入比移出多的区域。密度估计后的数据能够解释移民差比例地图。可以发现这些数据大部分都从蓝色区域指向红色区域。
  • 一种大规模空间相互作用数据的可视化框架——多分辨率多尺度的流向地图。算法通过改变邻域半径参数和搜索半径参数,在不同尺度和分辨率上发现空间模式。本用例分析了一组纽约市出租车数据。这组数据描述了在 2009 年 12 月 31 日曼哈顿区域的 388352 条载客数据。通过设置不同的搜索半径,可以在大搜索半径够获得一个出租车数据全局模式的理解。比如,最强的出租车流发生在宾州车站和中央车站之间,因为它们是纽约最繁忙的交通枢纽,特别是在圣诞前夕,人们都涌向城市来庆祝新年的到来;同时也可以在小的搜索半径下,展示不同街道的流量分布,从而发现具体路况变化。
  1. 郭殿升在“Flow Mapping and Multivariate Visualization of Large Spatial Interaction Data”中提出了一种探索性分析和大空间交互数据可视化的方法框架。该框架包括用于分层区域化,流映射,多变量聚类和可视化的方法。由于空间交互数据大容量、多变量、多种数据维度,可更改区域单元问题的特性,在应对大量流线并减少流图中的混乱方面,传统的导出和可视化线密度,或将边缘分组成束的方法存在一些局限性:首先,线密度或边缘捆绑方法使用给定的地理单位和组流线进入束,这些束没有明确地寻找并提供对自然区域的清楚理解难以发现有意义的模式和信息(文中以移民模式为例,其中自东北的高级移民倾向于迁移到东南部这一模式在传统方法中难以发现),其次,在可视化空间交互数据(例如迁移)时,地图中的流线表示起点和目的地之间的连接,并且可选地还可以使用诸如颜色和线宽的视觉变量来显示关于移动物体的信息。然而,线密度或边缘捆绑方法使得难以察觉起源和目的地之间的对应关系。
    针对以上问题文章提出了一种新的方法框架,用于大空间交互数据的探索性分析和可视化。给定这些位置之间的一组位置和一组交互(链接),所提出的分析框架包括以下过程以总结数据,发现一般模式并产生用于用户探索的交互式流程图。首先,使用新开发的区域化方法(郭的另一篇文中提出了一系列基于空间约束的层次聚类的区域化方法,包括单链接(SLK),完全链接(CLK)和平均链接(ALK)方法。)通过对空间交互网络进行最佳划分来提取自然区域(社区结构),使得区域内的流量比跨区域的流量多得多。其次,基于发现的区域聚合原始空间交互及其相关的多变量信息,以便可以在更高的抽象级别渲染流图以揭示主要的流模式。由于区域形成层次结构,因此流程图自然支持不同抽象级别的模式探索。第三,自组织映射用于执行流变量的聚类分析,并使用2-D颜色方案对聚类进行编码。流程图以颜色显示流动(代表聚类),因此可以同时理解多变量信息和流动结构。当用户向上或向下导航区域层次结构时,流量集及其关联的多变量值将发生变化,因此将自动再次执行群集。第四,支持各种用户交互以有效地促进空间交互模式的探索和准确解释。文中使用美国移民数据集,这组数据来源于 2000 年的人口普查。这次人口普查询问了人们五年前的居住位置,和现在的居住位置。这组数据包含了 5 年内(2000-2005)人口的移动信息。新的可视化框架生成的流向地图有效的解决了混乱问题,从而发现移民模式,例如其中自东北的高级移民倾向于迁移到东南部。

  2. 祝曦,郭殿升在“Mapping Large Spatial Flow Data with Hierarchical Clustering”中针对现有的流映射方法通常使用预定的高级地理单元(例如状态)来聚合流或者捆绑在空间上很近的部分流线,这两者都导致信息的显着丢失或失真并且可能错过主要模式的问题,提出了一种流聚类方法,它可以提取相似流的聚类,以避免混乱问题,揭示抽象的流模式,同时尽可能地保留数据分辨率。该方法扩展了传统的层次聚类方法,以聚合和映射大流量数据。新方法在确定两个流的相似性时考虑起源和目的地,这确保流集群表示从相似起源到类似目的地的流,从而最小化聚合期间的信息丢失。文章中分析了中国深圳市区一周工作周(5天)243,850次出租车行程的数据集。通过分层聚类映射的方法,有效的解决了流向地图视觉阻塞问题,同时还可以有效揭示数据和重要地点/区域的主要流动模式。例如,在流程图中可以轻松识别多个枢纽,包括与香港,火车站,地铁站和其他重要中心接壤的皇岗口岸。同时,流动图模式不仅可以很好地匹配位置测量模式,还可以显示具有清晰连接,方向和流动强度指示的更具体的流动模式。

  3. 郭殿升,祝曦在“Discovering Spatial Patterns in Origin-Destination Mobility Data”中针对“起源 - 目的地对”这一特定类型流动数据提出了一种发现和理解运动中时空模式的新方法。针对这一类特殊流动数据中点的聚类,需要将区域划分为更多群集以便能够以更精细的分辨率找到等多的模式。该要求还意味着该方法应该能够识别不同点密度的聚类。例如,虽然火车站的点数比住宅区的点密度要大,但两者都应该被认为是集群。因此,基于密度的聚类方法不满足此要求。此外,聚类方法不应采用预定形状(例如圆形)并且应该能够检测不同形状的聚类。例如,K-means聚类方法不满足此要求,因为它倾向于找到圆形聚类。最后,每个群集应该是空间连续的,这对于定义有意义的地方或区域是必要的。针对以上问题,文章提出了一种基于共享邻居数的点聚类方法,用于构建任意形状和不同点密度的聚类,同时为了确保空间连续性并实现效率,为所有位置构建Delaunay三角剖分。文章使用中国深圳的大型出租车轨迹数据集,所有出租车旅行的原始和目的地位置692,634。结合地图和可视化技术,最终结果可以有效的识别出具有现实中的地理位置。

  4. 郭殿升、祝曦在“Origin-Destination Flow Data Smoothing and Mapping”
    本文介绍了一种新的流数据映射方法,该方法从大量地理移动数据中提取固有模式,并构建有效的数据可视化表示,以便了解复杂的流动趋势。
    该方法能够从大量的空间相互作用数据中提取出固有的模式,并有效的可视化大量空间相互作用数据,从而理解复杂数据中的规律。该方法主要包含一种空间相互作用数据核密度估计模型和一种代表性数据选择的方法。这种方法能够去掉数据中的随机性误差,发掘现有方法不能发现的规律模式。该方法能够在分析和可视化大量空间相互作用数据的过程中,达到三个主要的目标。第一,通过核密度估计的方法除去了空间单元大小不同的影响。第二,通过一种新的抽样方法,在大量的数据中选择一组有代表性的数据。第三,能够有效的支持空间相互作用数据的可视化。文章中使用美国移民数据和合成数据实验的案例研究来评估和演示新方法,在生成的流向地图中获得一些新的美国全国和局部移民的信息。

猜你喜欢

转载自blog.csdn.net/weixin_42977802/article/details/83050669