PAROT: Translating natural language to SPARQL（PAROT：将自然语言翻译成SPARQL）--01

Author：Peter Ochieng（<——这个是作者！不要打赏我！我偷偷翻译的！）

Keywords:SPARQL；Natural language processing；Ontologies；Query （关键词：SPARQL；自然语言处理；本体（论）；检索（查询））

本文提供了一个基于依赖关系的框架，用于将自然语言转换为SPARQL。PAROT（本体论的回声问答-echos answers）使用了许多基于依赖关系（dependency）的启发式方法(heuristics)将用户的查询转换为三元组；然后，这些三元组被字典(lexicon)处理成本体三元组，这些本体三元组用于构造SPARQL查询。
1.介绍
在开发基于本体的聊天机器人中，设想开发一个工具，允许用户使用他们的自然语言(NL)，基于本体的知识库(KB)中的事实（答案）并与获取工具进行近乎自然的对话。这要求使用一个插件工具，将用NL（natural language）编写的用户语句转换为SPARQL查询语言（一种W3C推荐的查询本体的语言）。我们尝试了各种NL到SPARQL工具，如AquaLog，CASIA@12，Querix，AutoSPARQL，K-Extractor，SPARK，基于precision和recall也就是查准率和查全率等指标来选择最好的工具；这个过程中产生了一些问题：
Opposing scalar adjectives（相反的标量的形容词？）：在查询中，哪个是穿越密西西比的最长最短的河流？凸显了处理scalar adjectives标量形容词的重要性。
Negation（否定？）：哪些河流不流经阿拉斯加？或者哪条河既不流经阿拉斯加也不流经密西西比？
Numbered list（编号清单？）：流经阿拉斯加的河流清单？
Compound sentences（复合句？）：哪个女演员出演了《卡萨布兰卡》，并嫁给了一个出生在罗马的作家？主要问题是处理查询和联合过滤的问题。
除了这些弱点外，大多数ART（automated reasoning tools，自动推理工具ART）使用的技术无法捕捉底层知识库的整个词汇表，即他们不能充分地概括整个知识库，这影响了词的消歧过程，从而降低了查询的准确率和召回率。
本文包括的一些关键概念：
（1）设计一个lexicon（词典）：充分代表底层知识库的词汇表消除歧义；将知识库中的形容词实体用它们的正负标量（scalars）标记，解决在将NL转换为SPARQL时互相矛盾的标量形容词的问题。
（2）开发一些高覆盖率的句法启发式方法（high coverage syntactic heuristics），可以转换可能问题的不同场景以更正SPARQL查询。从评价来看，所开发的技术优于gAnswer（一个叫Zhao等等的人在2017年开发的方法，因为本文的地址没办法甩链接，所以以读后感的形式翻译了一下！本人非专业人士，请多多指正，互相成长！），也是QALD-9 challenge中表现最好的技术方法了！此方法能够有效地消除单词的歧义，并且对用户所诉问题的覆盖率很高（个人猜测此处写的是此方法的两点优势，一是消除歧义，二是对查询问题的解释表述更为清楚，覆盖面更广阔，不是有个“封闭世界”的假设嘛！这里应该是把“世界”范围扩大了！）。

PAROT: Translating natural language to SPARQL（PAROT：将自然语言翻译成SPARQL）--01

猜你喜欢