对话GPT-4:生成式人工智能正是知识图谱的大机遇

转载公众号 | 知识管理就在夏博


生成式人工智能只能根据它所接受的训练来回答问题或完成任务——除非它获得了外部知识。提供外部知识的“当前技术”是嵌入和使用向量数据库,但任何了解语义知识图谱的人都知道,它将可以提供更好的结果。

在过去的一段时间里,GPT-4被认为是“通用人工智能的火花”,所以我想应该问问它更喜欢哪一个。以下是和GPT-4的对话。

问题1:你有两种外部信息可供选择,一个是语义知识图谱,一个是向量数据库。想想完成问题或任务的步骤,作为LLM,这两种存储类型中哪一种更有可能为您提供所需的文本?

GPT-4:作为LLM,我会选择一个语义知识图谱来完成问题或任务。语义知识图谱以更结构化的方式表示实体和概念之间的关系,从而更容易识别特定问题或任务的相关信息。另一方面,向量数据库将信息表示为高维空间中的数字向量,这可能更难以直接解释和提取所需的文本。语义知识图谱的结构化特性将使我能够轻松导航并找到完成给定任务所需的信息。

问题2:请举五个问题或任务的例子,说明你为什么会做出这个选择。

GPT-4: 

1.“空气污染的主要原因是什么?”语义知识图谱将在实体和概念之间建立结构化的关系,从而更容易识别空气污染的原因。例如,它可以有“空气污染”和“原因”的节点,以及连接不同原因的边缘,如“工业排放”、“车辆排放”和“化工燃料燃烧”。

2. “列出莎士比亚的作品。”在语义知识图谱中,可能会有一个代表“威廉·莎士比亚”的节点连接到代表他个人作品的节点,比如“罗密欧与朱丽叶”、“哈姆雷特”和“麦克白”。这种结构使提取所需信息变得简单。

3.“描述光合作用的过程。”语义知识图谱会有代表光合作用过程的节点和边,包括“光”、“叶绿素”、“二氧化碳”、“水”和“氧”等概念。这些概念之间的结构化关系将使理解和描述过程变得更加容易。

4. “普通感冒的症状是什么?”语义知识图谱将有一个表示“普通感冒”的节点,连接到表示感冒各种症状的节点,如“打喷嚏”、“咳嗽”、“喉咙痛”和“流鼻涕”。这种结构化的信息可以很容易地提取和列出症状。

5. “哪些国家是欧盟的成员?”在语义知识图谱中,将有一个代表“欧盟”的节点连接到代表其成员国的节点,如“德国”、“法国”、“意大利”和“西班牙”。这些节点之间的连接将使识别和列出属于欧盟的国家变得容易。

问题3:幻觉对像你这样的LLM来说是个很严重的问题。如果在语义知识图谱中可以获得执行任务所需的信息,您认为这个问题可以消除吗?

GPT-4:虽然使用语义知识图谱可以通过提供结构化和准确的信息来显著减少幻觉的机会,但它可能无法完全消除问题。LLM像任何其他机器学习模型一样,仍然容易出错,偶尔可能会产生不正确或不相关的信息。然而,语义知识图谱的结构化本质无疑有助于缓解幻觉问题,因为它为LLM提供了更准确可靠的信息。

这就是——从GPT-4嘴里说出来的。大型语言模型LLM需要访问外部知识和数据,如果它们是普遍有用的,语义知识图谱会是LLM优选的知识结构。如果您是语义知识图谱应用程序的开发人员或提供者,那么可能再也不会有这样的好机会了。

5814361b105fd8253b73054077340bca.png

正如GPT-4所回答的那样,通过将LLM和知识图谱有效结合,我们相信可以发挥出1+1》2的力量,这也是信息研究和知识管理的未来——我们将从以传统搜索/文档为中心的方法转向由大型语言模型和知识图谱驱动的知识计算方法。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

5f8ada41a8562fe0d16e5870dcf71788.png

点击阅读原文,进入 OpenKG 网站。

猜你喜欢

转载自blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/130299196