论文分享 | 罗强等:GIS领域知识图谱进展研究

本文转载于《测绘地理信息》2023年2月第48卷第1期


GIS 领域知识图谱进展研究

罗强1,2 胡中南1,2 王秋妹1,2 石伟伟1,2 贾玥3

1北京超图软件股份有限公司,北京,100015

2 自然资源部地理信息系统技术创新中心,北京,100015

3 卡内基·梅隆大学,美国匹兹堡,15213

摘要:目前,GIS 领 域 的 人 工 智 能(artificial intelligence,AI)技术更多被应用于空间信息提取,虽已替代部分人工交互的工作,但还未达到决策层面的“智慧”。如何进一步解译和推理提取的空间信息,提炼出地理知识,从而实现地理决策,将是未来 GIS 发展的长远目标。知识图谱技术与 GIS 的结合可为实体赋予丰富的语义化信息和结构化信息,在空间对象的精细化管理、计算推理及辅助决策等方面有着广阔的发展前景。综合知识图谱在 GIS 领域的相关研究进展,从地理信息知识的抽取、融合、存储、检索和计算推理几个方面进行了系统阐述,总结了相关技术的难点与挑战,探索并展望了 GIS 知识图谱在三维时空信息及智慧城市建设等方面的应用。

关键词:知识图谱;语义网;时空关系;GIS;人工智能(artificial intelligence,AI)

Abstract:At present,artificial intelligence(AI)technology in the field of GIS is more widely used in the extraction of spatial information. Although it has replaced part of the work of artificial interaction,it is not smart at the decision level. How to further interpret and reason the extracted spatial information,and extract geographic knowledge to realize geographic decision will be the long-term goal of GIS development in the future. The combination of knowledge graph and GIS can give rich semantic information and structured information to entities,which has a broad development prospect in fine management,computational reasoning,decision-making assistance of spatial object. Based on the relevant research progress of knowledge graph in GIS,we systematically expound the extraction,fusion,storage,retrieval computational reasoning of geographic information knowledge,summarize the difficulties and challenges of relevant technologies,and explore and prospect the applications of GIS knowledge graph in 3D spatiotemporal information and smart city construction.

Key words: knowledge graph; semantic web; spatiotemporal relationship; GIS; artificial intelligence (AI)

近年来,得益于地理信息大数据的爆发和深度学习的迅猛发展,地理空间人工智能(geospatial artificial intelligence,GeoAI)[1]技术已初步实现了空间信息识别和提取等功能的自动化,步入了感知智能层次。但现阶段深度学习本质是概率统计意义下的拟合,无法让机器理解语义,实现逻辑推理和学习判断,其不透明性、不可解释性制约着 GIS 从感知智能向认知智能发展。Google 提出的知识图谱概念[2]将知识工程“自上而下”的方式转变为“自下而上”的挖掘数据、抽取知识的方式,被认为是实现认知智能的关键技术之一[3],推动了 AI在认识层面的创新。在 GIS 领域,空间实体语义关系的构建和地理概念表达是新型测绘领域亟待解决的问题。以语义网络为描述框架的知识图谱在 GIS 领域的应用既具有技术普适性又具有地理信息领域的专业特殊性,在地理知识理解、地学问题求解和时空预测等方面具有巨大的应用潜力[4]。在理论研究方面,陈述彭等[5]将概念网络化的思想引入地理学领域,首次提出了地学信息图谱概念;后续发展出的地学信息图谱的思想[6-9]丰富和完善了地学信息图谱的理论体系,形成了形、数、理一体化的研究手段。学者们进一步探索地理知识的存储,基于计算机图谱的思想,构建了地理知识库[10]、常识地理知识库[11]、中文地理知识库[12]、众包地理知识图[13]等一系列地理知识库。在 GIS 知 识图谱构建方面,张雪英等[4]提出了一种结合地理知识时空特征的知识图谱构建方法,并提出了地理知识图谱的表示方法;蒋秉川等[14]提出了基于多源异构数据的大规模地理知识图谱的构建技术流程。在 GIS 应用方面,知识图谱为发展更精准的 GIS 领域知识搜索引擎,以及位置服务信息的聚合和推送提供了重要的技术支撑,同时也是将地理信息服务拓展到地理知识服务的关键[15]。但目前知识图谱在 GIS 行业的应用尚处于起步阶段,应用场景不够广泛,技术适配度不高,因此,要继续探索和研究 GIS 与知识图谱的深度结合。

本文在前人研究成果的基础上,从地理信息角度较为系统地阐述了知识图谱的内涵及其在GIS领域的发展和应用情况。依据知识图谱技术架构,从地理知识抽取、融合、存储、检索和计算推理 5 个层面对 GIS 知识图谱进行了较为系统的归纳和剖析,并分析了当前GIS 知识图谱的主要应用方向,对GIS 知识图谱未来的研究重点进行了展望。

1 GIS 知识图谱研究进展

在GIS 领域,知识图谱构建的核心问题是建立地理时空关系和自然语言的空间关系映射,用于描述地理概念产生、发展及演变的状态。知识抽取、知识融合、知识存储、知识检索、知识计算推理是通用知识图谱技术的核心模块[16,17],参考通用知识图谱研究框架发展现状,本文对GIS领域知识图谱相应技术模块的研究进展进行讨论和分析。

1. 1 GIS 知识图谱抽取技术

随着智慧城市、数字孪生等概念的普及,多源异构大数据正逐渐成为GIS主流数据来源[18],知识抽取技术就是从这些不同结构和类型的数据中提取出来的计算机可理解和计算的结构化数据,抽取的内容包括实体、属性、关系。其中实体是对客观个体的抽象[19],实体属性指与实体相联系的变量或意义[20],关系则指实体间存在的各种语义关联[4]。近年来,以文本为主的地理信息理解问题得到了广泛关注,尤其面对半结构化、非结构化文本数据时,知识抽取成为不可或缺的一环。接下来,将从实体、属性、关系3个角度阐述GIS知识抽取的研究进展。

1. 1. 1 实体抽取

实体抽取是指由计算机从文本中抽取实体名称,常用的方法有规则匹配、机器学习、深度学习。GIS领域借助地名辞典进行规则匹配,实现简单、准确度高,但需要专家制定规则和模板,覆盖范围有限,很难适应数据变化新需求[21,22]。机器学习模型,如条件随机场、支持向量机、隐马尔可夫等,可有效提高实体识别性能[23-25],但要在实体抽取时建立训练语料库,这需要大量的人工标注,且监督学习算法不仅受限于训练集合,在准确率和召回率上表现也不够理想,而结合规则和统计的方法在识别命令实体时具有更好的召回率[26,27]。深度学习模型能够自动学习上下文特征,减少了对语料库的依赖,与其他机器学习模型相比,实体识别效果更佳[28],但GIS数据包含大量专业术语,加大了GIS实体识别难度。独凌子等[29]构建了地理信息服务语料库,在经典的序列标注模型BiLSTM-CRF (bidirectional long short-term memory-conditional random field)的基础上,引入自编码语言模型BERT(bidirectional encoder representation from transformers)预训练语言模型,并在BiLSTM-CRF前加入卷积神经网络(convolutional neural network,CNN),以更好地提取文本局部特征。储德平等[30]提出了 ELMOCNN-BiLSTMCRF模型,提高了对地质实体中复杂多义词的区分水平。但目前深度学习方法仍很难满足GIS开放领域的实体抽取,模型在不同场景下的泛化能力较低[31]。

1. 1. 2 属性抽取

综合GIS领域中实体的属性特征和自然语言中的描述特点,学者们分别从本体、规则匹配、监督学习和弱监督学习[14,32]方面讨论了实体属性的抽取。杨博等[33]使用规则和启发式算法自动抽取出相应的属性名称和属性值。在某些情况下,属性也可看作实体与属性值间的名词性关系,所以属性抽取可看作关系抽取的一种特殊情况。蒋焕剑[34]将属性抽取看作关系抽取,模糊了属性抽取和关系抽取方法的差异;郭剑毅等[35]把实体、属性、属性值看作 3 类实体,将这 3类实体的抽取问题转化为命令实体识别问题。

1. 1. 3 关系抽取

关系抽取为两个概念或实体之间的某种语义关系或关系类别。在GIS领域则更加侧重对时间和空间关系的抽取,基于相关规则可有效对文本中的时间关系进行抽取和计算。相较而言,空间关系的抽取难度更大,其抽取过程是GIS计算模型到自然语言空间关系的语义转换。有学者通过构建空间关系词典和句法模式库,使用模式匹配方法完成以句子为单位的空间 关系抽取[36,37];也有研究使用机器学习方法完成对空间关系的抽取,这能有效避免规则的局限性,但对空间关系语料库的规模及质量要求较高[38]。回标技术可有效解决手工标注语料库成本高昂的问题,实现快速自动构建实体关系语料库[39];深度学习模型在提取描述地理关系的位置信息和上下文信息等复杂语言特征上也表现出良好性能[40]。

1. 2 GIS 知识图谱融合技术

知识融合指将含义相同但具有不同标识符的实体进行合并处理,实现对同名、多名和缩写等多种实体语义的消歧和共指消解,将多个来源的关于同一个实体或概念的描述信息融合起来。主要使用的技术包括实体对齐、实体消歧。其中,实体对齐是匹配语义相同的实体,主要结合相似性度量和匹配方法对齐;实体消歧为消除不同文本中实体歧义,多结合特征或上下文相似度辅助消歧。

1. 2. 1 实体对齐

实体对齐是匹配或链接现实世界中的地理对象的实体,给定两个来自不同地理知识库的对象实体,实体对齐即决定实体对象是否匹配。目前实体对齐的研究主要包括相似性度量和匹配方法,每个相似性度量适用于特定场景[41]。Sun 等[42]从实体异构性角度对相似性度量进行分类,对词汇、结构、空间位置、类别、形状 5 种相似性度量进行了归纳总结。词汇相似性度量分为基于字符的相似性度量、基于标记的相似性度量和基于向量的相似性度量3 类;对于树状结构的地理知识库,结构相似性基于实体的上位节点集、下位节点集和兄弟节点集之间的关系来计算[43],图状结构地理知识库则只强调实体间的简单链接;空间相似性包括度量关系、拓扑关系和顺序关系;类别相似度常被用于地名匹配和位置解析;形状相似性度量关注实体几何形状间的差异[44]。对实体的多维特征进行相似性评分后,利用合适的相似度组合算法将其有机组合起来,再用实体对齐算法进行实体融合,最终形成对齐结果。组合算法可分为传统概率模 型[45]、机器学习[46-48]和神经网络等类别[49]。

1. 2. 2 实体消歧

实体的歧义分为多名和重名两类,多名指一个实体存在多种命名方式,如别名、缩写和全名等[50]。实体存在多名歧义时,往往通过将目标实体与同义词词典进行匹配或通过模糊匹配算法解决[51]。重名代表多个实体拥有相同的命名,通过对新闻语料库的调研发现,文本中约有 68% 的地名指称不同的实体[52],地理指称歧义现象制约了对地理知识文本时空语义的理解。实体消歧主要是去除命名实体的歧义。基于地图数据进行消歧是其中的一种常用方法,该方法是从歧义地名的多个候选地理位置中选择一个上下文距离最近的作为消歧后的结果[53]。Smith 等[54]基于位置地理坐标在地图上表示上下文语境中的位置,计算质心并与歧义地名相关的实际位置比较,与质心最近的位置被选为正确的地名;也有基于知识进行消歧的方法,该方法以地理本体、地理要素分类树为基础,通过计算候选实体与歧义命名实体之间的语义相似度进行消歧[55,56];Volz等[57]提出了一种基于本体的地名消歧方法,利用地名词典发现文本中候选的地理标识符,并基于消歧规则对地理特征进行排名;Ballatore等[58]设计了一种将给定地理词汇表映射到WordNet的无监督算法——Voc2WordNet,使用词频、词法重叠、显著分类3个指标来找到同义词,解决了词义消歧的问题;还有学者使用机器学习方法对地名进行消歧,如以维基百科为语料训练共现模型[59];利用多源异构知识集成多种方法也是地名消歧的一种思路[60]。

1. 3 GIS 知识图谱存储技术

将实体、关系和属性等信息以一定的形式表达并存储是知识图谱的关键技术之一,目前知识图谱存储可分为基于关系数据库的存储和基于原生图数据库的存储[2]。由于 GIS 数据大都来源多样且规模较大,使用关系数据库存储时将造成大量表连接、稀疏行和空值处理问题,同时由于建表索引的范式约束,在常见多跳查询时,关系数据库的计算复杂度随着跳数呈指数级增长。而基于原生图的数据库在建模灵活性及多跳查询等方面具有明显的优势,已成为知识图谱存储的主要解决方案[61]。目前基于原生图的数据库存储可分为资源描述框架(resource description framework,RDF)存储与属性图存储[62],在GIS 领域,知识图谱的存储应考虑到 RDF 存储和属性图存储的差异,并根据知识图谱的应用场景、底层数据的存储方式及上层图计算系统进行选择。

1. 3. 1 RDF 存储

借鉴知识图谱的表达模型,GIS 知识图谱可采用 RDF 表示三元组形式,形成“点-边”形式的大规模有向图[63]。RDF 有较好的理论模型基础,存储结构简单,具有标准的推理引擎,但查询复杂度较高,在大规模数据可扩展性方面表现不佳[62]。由于标准的 RDF 三元组不易表示地理语义数据的空间信息,这将影响空间索引的构建和空间信息的查询。为解决以上问题,目前很多研究普遍在RDF 中增加了空间声明,用于构建空间类型元组[64,65],如空间关系谓语集合和空间类型陈述。Wang等[66]对RDF图数据库引擎gStore 进 行扩展,增加了语义-空间混合索引,开发出能表达空间信息的 S-store 图数据库;段红伟等[16]基于 Jena Graph 扩展机制构建并实现了地理语义索引。

1. 3. 2 属性图存储

属性图是图存储的基本表示形式,是另一种管理知识图谱数据的常用数据模型,被业界广泛采用[67]。属性图存储通常具有更好的图分析性能,图数据库,如 Neo4j[68]和Titan[69]可以有效访问和管理GIS 知识图谱。图数据库主要采用图遍历或空间索引执行查询[70]。图遍历首先遍历图找到匹配的图模式,再计算空间谓词,最后过滤掉不满足空间谓词的顶点。空间索引先应用索引来查找所有能满足空间谓词的空间顶点,再从空间顶点集合开始遍历图,如Neo4j配备了一个扩展插件,可用于管理地理空间数据,能够导入、存储、查询空间数据,遵循OpenGIS的规范,支持的地理要素包括点、线段、面、多点、多线段等简单要素[71]。RDF图数据模型特征相对完善,在知识建模和逻辑推理上较属性图发展更成熟,但在复杂地理空间对象的描述和空间关系的表达上还需继续完善和拓展,地理空间数据检索效率也有待提高。属性图在理论方面有待完善,尚未形成工业标准,但最近几年 Neo4j 等图数据库的性能表现较好,在面对多层次嵌套的地理数据组织结构时,能够更高效地进行地理分析和地理规律提取。总的来说,RDF 存储在知识建模、知识关联及推理等方面更具有优势,属性图存储在图结构表达和查询分析方面性能更佳。

1. 4 GIS 知识图谱搜索技术

目前,大规模地理信息知识图谱的搜索可被应用于地图标签推荐及空间知识问答等方向。地理信息的搜索包括地理位置、地理方向、地理范围、空间距离等,具有丰富的空间语义和空间关系,在搜索时可根据地理搜索范围,通过距离、拓扑和方向等空间特性,检索出相关数据。传统的搜索未充分考虑到地理数据的差异与特点,不能很好地理解用户的搜索意图。考虑到GIS 数据的时空特性,可从以下方面进行搜索优化,提高查询效率:

1)采用相似度的近似匹配降低搜索延迟并提升搜索精度。在 GIS 领域,实体间具有丰富的语义信息,在语义相似度计算模型中,应考虑到实体具有的时空特征等因素对语义相似性的贡献[72]。周静等[73]在计算检索条件和检索对象间的相关程度时,使用了拓扑关系相似度、方位关系相似度、距离关系相似度来得到实体的相似度;陈永佩等[74]考虑到实体层次影响因素等,提出了地理语义相似度混合计算模型,综合了语义相似度概念间的关系、本体结构、属性和实体几何特征等影响因素来衡量地理概念间的语义相似度;索俊锋等[75]结合语义距离、信息量和属性等影响相似度的因素,提出一种概念间语义相似度的综合算法,获得了认知的信息检索结果。

2) 构建形式多样的图索引,采用“空间换时间”的策略削减子图匹配时的搜索空间。地理信息数据属于空间数据,包含对象的地理位置信息和一些拓扑及关联信息,在存储这些数据时,复杂程度较高。根据空间数据的关系及特性,构建空间索引,按照一定的顺序排列、存储、查询数据,能减少知识图谱数据存储代价并提升查询效率,常见的空间索引包括R-树[76]、四叉树、格网等。对具有时间和空间属性的地理信息数据构建时空索引能更快速进行查询。时空索引可分为过去信息索引、当前信息索引、将来信息索引、全时态信息索引,常见算法有 TB-Tree[77]、3DR-Tree[78]、2-3TR-Tree[79]、STP-Tree[80]等。

1. 5 图计算与知识推理

基于图拓扑结构的图计算和基于语义信息的知识推理都属于对GIS知识图谱的信息挖掘,是智能提炼地理知识,辅助地理决策的重要技术。在面对大量且复杂的GIS图结构数据时,图计算提供了众多信息挖掘算法,如图与路径搜索、中心度分析及社区发现等。GIS知识图谱为用户挖掘最佳的路径规划、最具影响力的节点、最合理的社区划分等深层次信息,能够为交通物流、城市规划、产业集群划分等提供决策参考。在 GIS 知识推理方面,学者们正在积极探索多种推理方式,包括基于传统规则推理、基于推理机推理、基于图神经网络推理等。刘鎏[81]将本体建模方法引入地理行业的知识图谱,通过使用网络本体语言(Web ontology language,OWL)形式化地表达了地理本体的空间和层次关系模型,构建了本体关系模型,并使用开源项目 Jena 推理机进行推理分析。毛文山[82]利用本体语言构建了行业知识图谱,对水污染进行追踪溯源,将地理对象的拓扑关系、方位关系和度量关系 3 种空间关系融入场景,通过规则推理实现污染源的过程追踪。李景文等[83]结合实体的属性与时空信息的关联性,使用径向基函数(radial basis function,RBF)网络实现对实体属性、时间与空间一体化的推理分析,为地理空间中复杂的时空预测和推理提供了新思路。深度学习技术的进步加速着图神经网络在GIS 知识图谱推理预测中的应用,Schlichtkrull 等[84]将知识图谱看作有向的多标签图,通过构建图卷积对实体间的关系进行建模,完成了链接的预测和实体的分类;周成虎等[85]基于异构图构建和图卷积神经网络的实体空间特征学习机制,构建动态时空关系模型,实现属性和时空之间的双向关联,可利用属性反推时空关系。

2 GIS 知识图谱应用展望

按照服务对象的不同,知识图谱在GIS领域的相关应用按可分为面向用户和面向智能平台的应用。面向用户的应用旨在利用知识图谱的相关功能更好地提供地理信息服务,如 Sun等[86]提出了地理知识图谱的索引框架,用于构建语义网络和地理空间的索引,实现位置感知搜索查询功能。谷歌地图使用知识图谱技术来优化查询功能,搜索景点时不仅显示原本的交通信息,还会根据搜索词显示相关的上下文信息,如景点历史文化。面向智能平台的应用则是让服务平台更好地具备地理知识,在识别和感知世界的基础上实现理解和推理现实世界的目标,如You等[87]实现了从数据到信息到知识最后到智慧的智能化转换的虚拟地理环境知识工程和服务。根据 Gartner 的分析,截至2021年,知识图谱正处于技术膨胀期,但知识图谱在GIS领域的应用还未广泛普及。此处对几个代表性的 GIS 应用方向进行应用现状分析和展望。

1) 融合三维时空信息方面的应用。当前,实景三维[88]和数字孪生概念已经逐步普及,但大多数城市三维模型存在“可视”而“不智”的问题,还远达不到人们对实体可计算、可管理、可决策的需求。GIS知识图谱在描述真三维时空中实体的属性及不同实体属性间的关系时,通过利用时空信息和坐标较好地关联与地理位置相关的多要素数据,能有效分析和挖掘实体间的相互作用和影响。相较于传统 GIS简单的空间分析,知识图谱基于精确的时空数据建立了知识体系,对于管理实体及分析实体间的关系起着重要作用。在孪生地理信息的大框架下,从多源数据中提取实体的数字孪生体,构建时空知识图谱,可实现实体的识别与理解、时空语义计算模型等功能。目前,GIS 相关厂商在地图或三维场景中融入知识图谱和传统 GIS 数据,能可视化分析实体间的关系,但知识关系较为简单,对复杂关系的推理和预测有待深入研究,并且要攻克实时动态更新实体语义关联、基于大规模时空知识图谱进行快速推理和计算等技术难点。

2) 融合社会大数据方面的应用。融合三维时空信息和社会大数据的知识图谱可被应用于智慧城市等多个方面。智慧城市中资源的配置和决策依赖于人类社会中的群体行为与社会结构,信息空间中的事件和主题,物理世界中空间位置信息之间的关联[3]。根据属性、特征、时空、语义和位置等信息建立相互关联的“人-事-地”的大规模知识图谱,对其中的关系进行深层分析、挖掘和推理,可实现对城市的精细化、科学化、智能化管理。蒋秉川等[89]结合时空信息和地理知识图谱语义网,构建了病人时空信息知识图谱,监控突发公共卫生事件的态势发展并分析病患间的关系。目前,信息孤岛化和平台多源化等问题造成了数据抽取和融合的难点,海量数据的融合和提炼技术还处于初级阶段,难以凝聚出可全面支持城市运营的信息和知识体系,未来在大规模多源异构数据的提取、融合方面还需要继续攻关。

3) 融合跨媒体智能方面的应用。时空大数据具有来源多样化的特点,基于时空坐标挖掘数据关联,可以融合表格、图像、音频等多模态跨媒体数据和地理信息数据,并建立多模态的知识图谱,从而完成实体识别、抽取、存储、融合、分析、推理与预测等功能。王新龙等[90]构建突发污染预案库,利用粒子群算法筛选出拟合度最高的污染源,再使用知识图谱关联分析企业污染物特征数据与污染物数据,确定排污企业。在GIS 产品应用方面,融合多源异构的多模态交通实时数据进行动态感知,通过智能分析构建交通信息知识图谱,可以实现智能交通的应用。但目前多模态知识图谱在GIS领域的研究还比较有限,相关技术的运用还比较初级,跨模态数据的管理、多模态 GIS 知识图谱构建、GIS 知识图谱普适化应用等方面仍面临着较大挑战。

3 结束语

GIS 知识图谱融合了AI、大数据、互联网和地理信息科学等技术,正在被越来越多的研究者关注。本文在对知识图谱定义、知识库和知识图谱架构阐述的基础上,从GIS知识图谱视角出发,结合专业特殊性,对地理信息的抽取、融合、存储、搜索、计算推理的研究现状进行了调研和分析,并结合当前的产业发展总结了GIS知识图谱在数字孪生、城市管理、环境保护和智慧出行等方面的应用。GIS知识图谱在地理空间数据采集、统一数据标准、构建地理知识库等方面具有巨大优势,能帮助机器理解和解释地理现象、推理新的地理知识。但目前该技术仍处于探索及初步应用阶段,知识图谱的构建和落地过程对人工依赖程度较高,导致成本高、效率低,知识图谱在GIS领域自动化、高质量、大规模的构建和应用仍有待持续探索与研究。随着智慧城市、数字孪生和实景三维建设的深度推进,未来GIS知识图谱在丰富地理语义信息、空间对象管理、地理信息决策等方面将有广阔的应用前景。

参考文献:

[1] 刘瑜,郭浩,李海峰,等. 从地理规律到地理空间人工智能[J]. 测绘学报,2022,51(6):1 062-1 069
[2] 田玲,张谨川,张晋豪,等. 知识图谱综述:表示、构建、推理与知识超图理论[J]. 计算机应用,2021,41(8):2 161-2 186
[3] 认知智能国家重点实验室,艾瑞咨询. 面向人工智能“新基建”的知识图谱行业白皮书[C]//艾瑞咨询系列研究报告(2020 年第 11 期).[出版者不详],2020:102-150,doi:10. 26914/c. cnkihy. 2020. 041860. 2020
[4] 张雪英,张春菊,吴明光,等. 顾及时空特征的地理知识图谱构建方法[J]. 中国科 学:信息科学,2020,50(7):1 019-1 032
[5] 陈述彭,岳天祥,励惠国. 地学信息图谱研究及其应用[J]. 地理研究,2000,19(4):337-343
[6] 齐清文,池天河. 地学信息图谱的理论和方法[J]. 地理学报,2001,56(B09):8-18
[7] 陈燕,齐清文,杨桂山. 地学信息图谱的基础理论探讨[J]. 地理科学,2006,26(3):306-310
[8] 廖克. 地学信息图谱的探讨与展望[J]. 地球信息科学,2002,4(1):14-20
[9] 傅肃性. 遥感专题分析与地学图谱[M]. 北京:科学出版社,2002
[10]Chaves M S,Silva M J,Martins B. GKB-Geographic Knowledge Base[EB/OL].[2005-05-05]. http://www.linguateca. pt/documentos/gkb_technical_report. pdf
[11] Zhang Y, Gao Y, Xue L L, et al. A Common Sense Geographic Knowledge Base for GIR[J]. Science in China Series E: Technological Sciences,2008,51(1):26-37
[12] Li J, Liu R, Xiong R. A Chinese Geographic Knowledge Base for GIR[C]. 2017 IEEE International Conference on Computational Science and Engineering (CSE) and IEEE International Conference on Embedded and Ubiquitous Computing, Guangzhou, China,2017
[13] Chen J, Deng S, Chen H . CrowdGeoKG: Crowdsourced Geo-knowledge Graph[C]. China Conference on Knowledge Graph and Semantic Computing, Chengdu, China,2017
[14] 蒋秉川,万刚,许剑,等. 多源异构数据的大规模地理知识图谱构建[J]. 测绘学报,2018,47(8):1 051-1 061
[15] 陆锋,余丽,仇培元 . 论地理知识图谱[J]. 地球信息科学学报,2017,19(6):723-734[16] 段红伟,孟令奎,黄长青,等. 面向SPARQL查询的地理语义空间索引构建方法[J]. 测绘学报,2014,43(2):193-199
[17] Gür N,Pedersen T, Zimanyi E, et al. A Foundation for Spatial Data Warehouses on the Semantic Web[J].Semantic Web,2017,9(2):1-31
[18] 宋关福,钟耳顺,吴志峰,等 . 新一代GIS基础软件的四大关键技术[J]. 测绘地理信息,2019,44(1):1-8
[19] 吴金红,吴容正. 基于知识图谱的科学数据开放核心政策研究[J]. 武汉纺织大学学报,2022,35(05):21-28
[20] 张军海 . 地理信息系统原理与实践:第2版[M]. 北京:科学出版社,2015
[21] Zaila Y L, Montesi D. Geographic Information Extraction, Disambiguation and Ranking Techniques[C].Proceedings of the 9th Workshop on Geographic Information Retrieval, Paris, France,2015
[22] 杜萍,刘勇. 基于本体的中文地名识别[J]. 西北师范大学学报(自然科学版),2011,47(6):87-93
[23] 钱晶,张杰,张涛. 基于最大熵的汉语人名地名识别方法研究[J]. 小型微型计算机系统,2006,27(9):1 761-1 765
[24] 邬伦,刘 磊,李 浩 然,等. 基于条件随机场的中文地名识别方法[J]. 武汉大学学报·信息科学版,2017,42(2):150-156
[25] 王克永. 面向网页文本的地理信息要素提取与空间定位方法研究[D]. 泰安:山东农业大学,2015
[26] 鞠久朋,张伟伟,宁建军,等. CRF 与规则相结合的地理空间命名实体识别[J]. 计 算机工程,2011,37(7):210-212
[27] Tahrat S,Kergosien E, Bringay S, et al. Text2geo:From Textual Data to Geospatial Information[C]. Proceedings of the 3rd International Conference on Web Intelligence, Madrid, Spain,2013
[28] 张雪英,叶鹏,王曙,等. 基于深度信念网络的地质实体识别方法[J]. 岩石学报,2018,34(2):343-351
[29] 独凌子,肖桂荣 . 地理信息服务领域的实体自动化识别[J]. 海南大学学报(自 然 科 学 版),2021,39(4):331-339
[30] 储德平,万波,李红,等. 基于ELMO-CNN-BiLSTM-CRF模型的地质实体识别[J]. 地球科学,2021,46(8):3 039-3 048
[31] 郑洪浩,宋旭晖,于洪涛,等. 基于深度学习的中文命名实体识别综述[J]. 信息工程大学学报,2021,22(5):590-596
[32] Imran M, Elbassuoni S, Castillo C, et al. Extracting Information Nuggets from Disaster-Related Messages in Social Media[C]. The 10th International Conference on Information Systems for Crisis Response and Management,Baden-Baden,Germany,2013[33] 杨博,蔡东风,杨华. 开放式信息抽取研究进展[J].中文信息学报,2014,28(4):1-11[34] 蒋焕剑. 基于深度学习的属性抽取技术研究[D]. 杭州:浙江大学,2017
[35] 郭剑毅,李真,余正涛,等. 领域本体概念实例、属性和属性值的抽取及关系预测[J]. 南京大学学报(自然科学版),2012,48(4):383-389
[36] Zhu S N, Zhang X Y, Zhang C J. Syntactic Pattern Recognition of Geospatial Relations Described in Natural Language[C]. Proceedings of 2010 International Conference on Broadcast Technology and Multimedia Communication,Chongqing, China,2010
[37] 余丽,陆锋,刘希亮. 开放式地理实体关系抽取的Bootstrapping 方 法[J]. 测 绘 学 报 ,2016,45(5):616-622
[38] Zhang X Y, Zhang C J, Du C L, et al. SVM Based Extraction of Spatial Relations in Text[C]. 2011 IEEE International Conference on Spatial Data Mining and Geographical Knowledge Services, Fuzhou, China,2011
[39] 王姬卜,陆锋,吴升,等. 基于自动回标的地理实体关系语料库构建方法[J]. 地球信息科学学报,2018,20(7):871-879
[40] 王海波,王姬卜,黄宗财,等. 结合实体词与句子语义的地理实体关系抽取[J]. 测 绘科学技术学报,2018,35(6):633-636
[41] Li Y,Qiu P Y, Liu X L, et al. A Holistic Approach to Aligning Geospatial Data with Multidimensional Similarity Measuring[J]. International Journal of Digital Earth,2018(8):845-862
[42] Sun K, Zhu Y Q, Song J. Progress and Challenges on Entity Alignment of Geographic Knowledge Bases[J].ISPRS International Journal of Geo-Information,2019,8(2):77
[43] Khatami R, Alesheikh A A, Hamrah M. A Mixed Approach for Automated Spatial Ontology Alignment[J].Journal of Spatial Science,2010,55(2):237-255
[44] Veltkamp R C,Hagedoorn M . State of the Art in Shape Matching[M]//Lew M S. Principles of Visual Information Retrieval. Berlin:Springer,2001
[45] Winkler W E. Methods for Record Linkage and Bayesian Networks[R]. Technical Report, Statistical Research Division,US Census Bureau, Washington,DC,2002
[46] 庄严,李国良,冯建华. 知识库实体对齐技术综述[J]. 计算机研究与发展,2016,53(1):165-192
[47] Santos R, Murrieta-Flores P, Martins B. Learning to Combine Multiple String Similarity Metrics for Effective Toponym Matching[J]. International Journal of Digital Earth,2018,11(9):913-938
[48] Martins B,Galhardas H,Goncalves N. Using Random Forest Classififiers to Detect Duplicate Gazetteer Records[C]. Proceedings of the 7th Iberian Conference on Information Systems and Technologies (CISTI 2012), Madrid, Spain,2012
[49] Chen Z G, Song J, Yang Y P. Similarity Measurement of Metadata of Geospatial Data: An Artificial Neural Network Approach[J]. ISPRS International Journal of Geo-Information,2018,7(3):90
[50] 温萍梅,叶志炜,丁文健,等. 命名实体消歧研究进展综述[J]. 数据分析与知识发现,2020,4(9):15-25
[51] Zhu G G, Iglesias C A. Exploiting Semantic Similarity for Named Entity Disambiguation in Knowledge Graphs[J]. Expert Systems With Applications,2018,101:8-24
[52] Garbin E, Mani I. Disambiguating Toponyms in News[C]. Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing, Vancouver, Columbia,2005
[53] 王志宝,夏昊,王成波 . 地理信息检索关键技术研究综述[J]. 计算机工程与科学,2018,40(3):533-543
[54] Smith D A, Crane G. Disambiguating Geographic Names in a Historical Digital Library[C]. Proceedings of the 5th European Conference on Research and Advanced Technology for Digital Libraries, Darmstadt,Germany,2001
[55] 朱少楠,张雪英,李明,等. 基于行政隶属关系树状图的地名消歧方法[J]. 地理与地理信息科学,2013,29(3):39-42
[56] Adelfio M D, Samet H. GeoWhiz: Toponym Resolution Using Common Categories[C]. Proceedings of the 21st ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, Orlando, Florida,2013
[57] Volz R, Kleb J, Mueller W. Towards OntologyBased Disambiguation of Geographical Identifiers[C].The Sixteenth International WWW Conference,Banff,Alberta, Canada,2007
[58] Ballatore A, Bertolotto M, Wilson D C. Linking Geographic Vocabularies through WordNet[J]. Annals of GIS,2014,20(2):73-84
[59] Overell S, Rüger S. Using Co-occurrence Models for Placename Disambiguation[J]. International Journal of Geographical Information Science,2008,22 (3):265-287
[60] Lieberman M D, Samet H. Multifaceted Toponym Recognition for Streaming News[C]. Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval, Beijing, China,2011
[61] 陈华钧 . 知识图谱导论[M]. 北京:电子工业出版社,2021
[62] 王鑫,邹 磊,王朝坤,等. 知识图谱数据管理研究综述[J]. 软件学报,2019,30(7):2 139-2 174
[63] 路威,赵丽君. 兵要知识图谱的构建与应用研究[J].测绘地理信息,2022,47(4):119-123
[64] Kyzirakos K, Karpathiotakis M, Koubarakis M. Strabon: A Semantic Geospatial DBMS[C]. The 11th International Semantic Web Conference,Boston,USA,2012
[65] Gür N, Hose K, Pedersen T B, et al. Modeling and Querying Spatial Data Warehouses on the Semantic Web [C]. The 5th Joint International Semantic Technology Conference, Yichang, China,2015
[66] Wang D, Zou L, Feng Y S, et al. S-store: An Engine for Large RDF Graph Integrating Spatial Information[C]. 18th International Conference on Database Systems for Advanced Applications, Wuhan, China,2013
[67] 潘理虎,张佳宇,张英俊,等. 煤矿领域知识图谱构建[J. 计算机应用与软件,2019,36(8):47-54
[68] Neo4j. NEO4J GRAPH DATA PLATFORM[EB/OL].[2022-03-26]. https://neo4j. com/
[69] Titan. Titan Distributed Graph Database[EB/OL].[2022-04-01]. http://titan. thinkaurelius. com/
[70] Sun Y H, Yu J, Sarwat M. Demonstrating Spindra: A Geographic Knowledge Graph Management System[C]. 2019 IEEE 35th International Conference on Data Engineering,Macao, China,2019
[71] 金鼎,曹建成,王文杰,等. 政务空间数据关系融合技术研究和实现[J]. 测绘地理信息 ,2020,45(5):126-128
[72] 宋佳,王卷乐,诸云强,等. 基于地理空间本体的语义检索相关度研究[J]. 计算机工程与应用,2011,47(5):114-117
[73] 周静,张书亮,张小波. 顾及地理实体的地名信息检索方法研究[J]. 地球信息科学学报,2015,17(11):1 362-1 369
[74] 陈永佩,杜震洪,刘仁义,等. 一种引入实体的地理语义相似度混合计算模型[J]. 浙江大学学报(理学版),2018,45(2):196-204
[75] 索俊锋,刘勇,邹松兵. 基于地理本体的综合语义相似度算法[J]. 兰州大学学报(自然科学版),2017,53(1):19-27
[76] Tian Y, Rhodes P J. A Location Service for Partial Spatial Replicas Implementing an R-Tree in a Relational Database[J]. Journal of Parallel and Distributed Computing,2016,90/91:9-21
[77] Pfoser D, Jensen C S,Theodoridis Y. Novel Approaches to the Indexing of Moving Object Trajectories[C]. Proceedings of the 26th International Conference on Very Large Databases,Cairo,Egypt,2000
[78] Theodoridis Y, Vazirgiannis M, Sellis T. Spatiotemporal Indexing for Large Multimedia Applications[C].Proceedings of the Third IEEE International Conferenceon Multimedia Computing and Systems, Hiroshima, Japan,2013
[79] Abdelguerfi M, Givaudan J, Shaw K, et al. The 2-3TR-Tree, A Trajectory-Oriented Index Structure for Fully Evolving Valid-Time Spatio-Temporal Datasets[C]. Proceedings of the 10th ACM International Symposium on Advances in Geographic Information Systems, McLean, Virginia, USA,2002
[80] Tao Y,Faloutsos C,Papadias D, et al. Prediction and Indexing of Moving Objects with Unknown Motion Patterns[C]. ACM SIGMOD International Conference on Management of Data, Paris, France,2004
[81] 刘鎏. 基于地理本体的吉林地域知识图谱的构建[D].北京:北京交通大学,2017
[82] 毛文山. 基于知识图谱关系推理的水污染事件追踪溯源方法研究[D]. 兰州:兰州交通大学,2020
[83] 李景文,王珂,叶良松,等 . 基于 RBF 神经网络的地理时空信息预测推理方法[J]. 广西师范大学学报(自然科学版),2014,32(4):59-65
[84] Schlichtkrull M, Kipf T N, Bloem P, et al. Modeling Relational Data with Graph Convolutional Networks[C]. European Semantic Web Conference, Crete,Greece,2018[85] 周成虎,王华,王成善,等. 大数据时代的地学知识图谱研究[J]. 中国科学:地球科学 ,2021,51(7):1 070-1 079
[86] Sun Y H, Sarwat M. A Generic Database Indexing Framework for Large-Scale Geographic Knowledge Graphs[C]. Proceedings of the 26th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, Seattle, USA,2018
[87] You L, Lin H. Towards a Research Agenda for Knowledge Engineering of Virtual Geographical Environments[J]. Annals of GIS,2016,22(3):163-171
[88] 张帆,黄先锋,高云龙,等. 实景三维中国建设技术大纲(2021版)解读与思考[J]. 测绘地理信息,2021,46(6):171-174
[89] 蒋秉川,游雄,李科,等. 利用地理知识图谱的 COVID-19 疫情态势交互式可视分析[J]. 武汉大学学报·信息科学版,2020,45(6):836-845
[90] 王新龙,薛晓鹏,孙如飞 . 基于粒子群与知识图谱的突 发 水 污 染 事 件 溯 源 方 法[J]. 水 力 发 电 ,2020,46(2):17-21

技术交流/科研合作/客座实习/联合培养请投递:[email protected]

「未来GIS实验室」作为超图研究院上游科研机构,致力于洞见未来GIS行业发展方向,验证前沿技术落地可行性,以及快速转化最新研究成果到关键产品。部门注重科研和创新功底,团队气氛自由融洽,科研氛围相对浓厚,每个人都有机会深耕自己感兴趣的前沿方向。

猜你喜欢

转载自blog.csdn.net/futuregislab/article/details/129144272