PAROT: Translating natural language to SPARQL(PAROT:将自然语言翻译成SPARQL)--01

Author:Peter Ochieng(<——这个是作者!不要打赏我!我偷偷翻译的!)

Keywords:SPARQL;Natural language processing;Ontologies;Query (关键词:SPARQL;自然语言处理;本体(论);检索(查询))

本文提供了一个基于依赖关系的框架,用于将自然语言转换为SPARQL。PAROT(本体论的回声问答-echos answers)使用了许多基于依赖关系(dependency)的启发式方法(heuristics)将用户的查询转换为三元组;然后,这些三元组被字典(lexicon)处理成本体三元组,这些本体三元组用于构造SPARQL查询。
1.介绍
       在开发基于本体的聊天机器人中,设想开发一个工具,允许用户使用他们的自然语言(NL),基于本体的知识库(KB)中的事实(答案)并与获取工具进行近乎自然的对话。这要求使用一个插件工具,将用NL(natural language)编写的用户语句转换为SPARQL查询语言(一种W3C推荐的查询本体的语言)。我们尝试了各种NL到SPARQL工具,如AquaLog,CASIA@12,Querix,AutoSPARQL,K-Extractor,SPARK,基于precision和recall也就是查准率和查全率等指标来选择最好的工具;这个过程中产生了一些问题:
      Opposing scalar adjectives(相反的标量的形容词?):在查询中,哪个是穿越密西西比的最长最短的河流?凸显了处理scalar adjectives标量形容词的重要性。
      Negation(否定?):哪些河流不流经阿拉斯加?或者哪条河既不流经阿拉斯加也不流经密西西比?
      Numbered list(编号清单?):流经阿拉斯加的河流清单?
      Compound sentences(复合句?):哪个女演员出演了《卡萨布兰卡》,并嫁给了一个出生在罗马的作家?主要问题是处理查询和联合过滤的问题。
      除了这些弱点外,大多数ART(automated reasoning tools,自动推理工具ART)使用的技术无法捕捉底层知识库的整个词汇表,即他们不能充分地概括整个知识库,这影响了词的消歧过程,从而降低了查询的准确率和召回率。
      本文包括的一些关键概念:
 (1)设计一个lexicon(词典):充分代表底层知识库的词汇表消除歧义;将知识库中的形容词实体用它们的正负标量(scalars)标记,解决在将NL转换为SPARQL时互相矛盾的标量形容词的问题。
 (2)开发一些高覆盖率的句法启发式方法(high coverage syntactic heuristics),可以转换可能问题的不同场景以更正SPARQL查询。从评价来看,所开发的技术优于gAnswer(一个叫Zhao等等的人在2017年开发的方法,因为本文的地址没办法甩链接,所以以读后感的形式翻译了一下!本人非专业人士,请多多指正,互相成长!),也是QALD-9 challenge中表现最好的技术方法了!此方法能够有效地消除单词的歧义,并且对用户所诉问题的覆盖率很高(个人猜测此处写的是此方法的两点优势,一是消除歧义,二是对查询问题的解释表述更为清楚,覆盖面更广阔,不是有个“封闭世界”的假设嘛!这里应该是把“世界”范围扩大了!)。

猜你喜欢

转载自blog.csdn.net/weixin_45799003/article/details/110307933