PAROT: Translating natural language to SPARQL(PAROT:将自然语言翻译成SPARQL)--03

Author:Peter Ochieng(<--这个是作者!)

3.PAROT结构
3.1 Step1:识别目标
      识别用户提交的自然语言查询语句并提取目标词汇,该目标词汇可以直接放置在SPARQL的SELECT之后。为了帮助识别用户提交的查询中的目标词汇,我们使用类型化依赖解析器(typed dependency parser),如Stanford类型化依赖解析器(2015,Marneffe & Manning--Standford typed dependency parser)。该依赖器可以识别语法关系并且提取词汇。为了提取查询中的目标字,我们把查询分为两类:Wh(WRB,WP,WDT)、non WH(读到这里,我还不知道它们是什么的缩写!?)。
3.1.1 基于Wh目标词汇的查询
       此类查询由Wh开始的词汇组成,比如什么、何时、哪里、谁、谁的、哪一个、是谁、为什么、怎样(what, when, where, who, whom, which, whose, why, and how)。为了识别此类查询中的目标词汇,我们在方程1、2中应用两种关键的规则(方程在下面)。

公式的图片


(对于方程的个人理解:1a-->任意x、y条件下的W,使用nsubj能够产生目标W;1b-->任意x、y、z下的W通过nsubj和conj能够产生目标W;2a和2b使用nsubjpass差不多能够产
生对应的结果。)
         这里,dep(x,y)是存在于x和y之间的依赖关系。句子的单词构成函数操作的域的常量。(1a)(1b)适用于非关系查询(3.2.1会例外说这个问题)。它们基本上识别用户提交的查询中的标称主题(nominal subjects),并将它们标记为目标。(1a)提供了一个头部主题与任何其他标称(nominal)之间没有连词(conjunct)关系的查询,比如,人口最多的州的面积是多少?(What is the area of the most populated state ?)依据Stanford依赖解析器依赖关系图如图1(Fig.1)所示。

fig01


    公式(1a)的在此项查询的具体应用如下图所示:

公式的具体应用
通过1a的公式,分析出了无连接词的情况下,找到了目标词汇!


    单词is和are之间的依赖项nsubj(is,area)保持不变,因此,选择标称area作为查询的目标。如果用户输入查询为“人口最多的州的面积和人口是多少(What is the area and population of the most populated state ?)”,依赖解析器依赖关系图就会类似于图2(Fig.1)所示。

is和area之间的依赖项保持不变,之前这个作者引用了一篇文章,好像有这个!搞不懂和这个变与不变都是指什么的??


         由于在这个查询中,头部主题区域是通过“and”关联其他标称的,所以公式(1b)适用(此查询的公式应用如下图所示)。

这里area和population都被选做了目标词汇。通过coordination conjunction协调连接,这个规则基于多个标称(nominal)与头部主题(head subject)之间的联系还可以捕捉场景,比如,and、or和“,”,再比如“人口最多的州的人口,面积和首都是多少?(What is the population, area and capital of the most populated state?)”。
         在公式(2a)(2b)里面的规则适用于基于关系的查询。它们依靠识别用户提交查询中的被动标量主题(passive nominal subjects)标记(flag)查询中的主题词汇。(2a)应用于头部主题不通过conjunction连接词连接其他标量(nominal)的情况,比如查询为“哪个德国演员在车祸中丧生(Which German actor was killed in a roadcrash ?)”,标量actor被选为目标词汇。(个人理解,was killed是个被动语态,所以识别出actor为目标词汇,which为头部词汇)


         公式(2b)通过coordination conjunction协调连接,这个规则基于多个标称(nominal)与头部主题(head subject)之间的联系还可以捕捉场景,比如,and、or和“,”(类比前面的1b),再比如“哪个德国演员和音乐家在车祸中丧生?(Which German actor and musician were killed in a road crash?)”,标称actor和musician被选择为目标词汇。
 

(个人爱好,多多指正,这个过程,主要磨练心智,还能够让我更宁静!)

猜你喜欢

转载自blog.csdn.net/weixin_45799003/article/details/110391532