城市功能区与人群流动研究论文阅读——《Simultaneous Urban Region Function Discovery...》

Simultaneous Urban Region Function Discovery and Popularity Estimation via an Infinite Urbanization Process Model

  • 关键词:Urban computing, urban function discovery, Bayesian
    nonparametric, and topic modeling.

1.背景、意义和目标

(1)背景:
城市化是趋势,城市系统是最复杂的城市经济系统之一,通过观察发现城市系统中存在两个主要的特点:显著的多样化和不平等(不同的城市区域呈现不同的城市化模式,提供不同的城市功能)、空间的相关性。以往的研究都是聚焦于单个区域的城市功能区域研究,很少有聚集于集成化数据的跨区域城市研究,很少考虑隐藏在不同城市区域的跨领域城市发展模式,很少有研究关注于整合来自不同领域的城市数据,发现不同领域之间的相关性,并从跨领域的城市数据中获得见解。
在这里插入图片描述
(2)意义:
满足各类城市化不同需求:公共基础设施、交通出行、能源、居住、教育、健康和通信。

(3)目标:
发展数据分析能力,发现潜在的跨区域城市化模式,根据功能相似性对城市区域进行聚类,预测特定领域的区域受欢迎程度。
提出一个IUP(infinite urbanization process 无限制城市化进程)模型,是一个在城市区域划分空间上由一个依赖于贝叶斯非参数先验的新层次空间距离控制的生成监督主题模型。***结合了监督潜在主题建模方法和距离相关贝叶斯非参数方法的优点。主要目的是利用城市功能表示来预测城市区域在特定领域的受欢迎程度。***(城市功能发现和区域流行度预测)
在这里插入图片描述

2.研究内容·

定义和发现隐藏在跨区域城市数据下的潜在城市发展模式;·基于城市化模式进行城市区域聚类;·根据发现的跨域关联和模式对目标域进行预测;

3.算法?理论?

(1)监督主题模型潜在的狄利克雷分布(LDA)
对于大量的文本分析任务具有优势,虽然作为无监督的主题学习模型可以帮助降低文本的维度,但是却很难被用来预测文本的回复(如文档的相关性排名),只能描述一般的主题而不能利用监督信息。
因此以监督性潜在的狄利克雷分布(sLDA)来解决监督学习问题,通过共同的主题学习和文档回复的回归系数来克服以上问题,sLDA的生成过程如下:
在这里插入图片描述
注:变量d和n分别表示文档和词的索引,变量N表示词的数量,变量T表示主题的数量,变量θ和ϕ分别表示以ζ 和β作为超参数的文档的主题分布和词汇表上的主题分布。

(2)距离依赖性(划分的贝叶斯无参数先验)
中国餐馆进程(CRP)是一个概率度量上的分布,是三大流行的重点分析聚类特性的DP(Dirichlet process)之一,广泛用贝叶斯无参化先验来作为聚类方法和混合模型,避免了大多数参数化模型的选择问题。以CRP为先验的模型可以在不事先知道簇数的情况下,自动从数据中获取簇数。简单的举例说明CRP的生成过程:客户多的桌子比客户少的桌子更容易吸引新的客户前来就坐。其聚类结果不受客户顺序影响(互换性假设),但是不适用于城市区域的聚类,区域相近的其人口构成和城市功能需求更加相似。
ddCRP(distance dependent CRP)修改了CRP,使新来的客户就坐于离其最近的朋友桌子。以ci表示客户的分布,简介决定了桌子的分布ti,其中i表示客户的索引,客户的分布由下决定:(距离相近功能相似情况)
在这里插入图片描述
(距离远功能相似情况)在ddCRP之上引入了另一个层次结构层(标准CRP),其将由ddCRP生成的连接的SUSAs进一步分组为集群。
总结:这种依赖于空间距离的层次贝叶斯非参数先验既可以通过空间ddCRP获取空间相干性,又可以通过标准CRP层获取城市功能相似性。以上两部分与城市功能区域挖掘和区域聚集的对应关系:
在这里插入图片描述
(3)IUP模型
核心思想:

IUP模型拥有一个监督化的主题模型来发掘潜在的城市功能和预测城市区域受欢迎度,通过一个在城市区域划分上的空间距离相关的层次贝叶斯非参数先验来对管理城市区域聚类和城市功能产生。IUP模型生成过程如下:
在这里插入图片描述

4.研究方法

推理的关键部分:推断聚类索引和SUSAs的城市功能分布
(1)以IUP模型的SUSA分配为例:
以Z、W、Y为数据向量,得到了SUSA赋值ci在其他参数、超参数和观测值上的条件分布。
在这里插入图片描述
前半部分根据公式一确定,后面的似然项可以进一步分解如下:
在这里插入图片描述
其中Π(·)表示从客户分布到桌子分布的转换。对于一个特定的集群,其联合分布可以表示为:
在这里插入图片描述
计算似然项:详细见论文!
在这里插入图片描述

5.结论与展望

提出了一种基于跨域城市数据挖掘城市功能,同时预测城市在特定领域的受欢迎程度的无限城市化进程(IUP)模型。提出的IUP模型在城市区域划分空间上具有依赖于空间距离的层次贝叶斯非参数先验。它可以看作是中餐馆特许经营(CRF)的延伸,其中顾客(最小的城市统计面积)的分配是由一个空间的ddCRP而不是CRP来管理的,而菜的分配(跨餐馆的桌子分组)仍然是由一个标准的CRP来管理的。利用这种层次贝叶斯非参数先验,可以将具有相似城市功能的城市区域聚在一起,而且不需要预先设置城市区域集群的数量,这样会造成差异,影响性能。相反,该模型可以从提供的数据中自动学习集群的数量。实证研究表明,IUP模型能够很好地捕捉潜在的城市发展主题,并利用所获得的紧凑的城市主题表示对特定领域的城市流行度做出准确的预测。
在未来的工作中,可以为潜在表示空间的维数增加一个贝叶斯非参数先验。另一个可能的扩展是考虑城市区域功能随时间的变化。提出的模型可以扩展到捕捉城市发展的时间模式。

[参考文档]Simultaneous Urban Region Function Discovery and Popularity Estimation via an Infinite Urbanization Process Model

发布了12 篇原创文章 · 获赞 13 · 访问量 756

猜你喜欢

转载自blog.csdn.net/qq_28406091/article/details/104460270

相关文章