大模型“幻觉”无解?图技术成下一个突破口

让答案变得更可信,图技术将成为大语言模型(英文:Large Language Model,缩写LLM)发展的下一个落脚点。

回溯大模型的加速发展,需要将时间线推回到去年12月,ChatGPT在全球范围内现象级爆火。用户侧拉动市场侧迅速爆发,截至目前,全球已出现近百个大语言模型。

而当国内数十个大模型出现后,ChatGPT的关注度也在被迅速瓜分。根据SimilarWeb数据,前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,后期则随着时间的推移增长率逐渐放缓。6月份ChatGPT网站的全球桌面和移动流量比5月份下降了9.7%,而ChatGPT网站的独立访问量下降了5.7%。Sameweb数据显示,访问者在网站上花费的时间也下降了8.5%。

而ChatGPT的使用率逐渐降低,和其难以保证的准确率密不可分。许多用户均在社交平台中反馈到,目前AI聊天过程中有时会收到似乎正确但细读却十分荒谬的答案,又或者是微调提问的方式会得到完全不同的答案,更有甚者会提供混乱的信息,此类信息难以直观发现,需要一定的行业知识才能发现。

事实上,正确性已成为所有大语言模型在发展中不可回避的问题。 尤其当大模型需要应用到医疗、健康、保险、银行、金融、工业制造等行业的业务场景中时,则对容错率的要求近乎0。因为一旦大模型提供错误甚至有偏差的信息,都有可能引起巨大的法律责任或公关危机。

image.png

所以,从现实发展看,大语言模型战场的厮杀必将进入下一阶段——让答案摆脱一本正经地胡说八道,变得100%可信。

一本正经地胡说八道,成为大模型的最大漏洞之一

笔者咨询大模型业内人士后了解到:目前流行的大模型主要以GPT类模型为主流,此类模型大多为纯解码器结构,使用n-gram方法,基于参数为Θ的神经网络建模,根据前k个单词来预测第k+1个单词。在海量语料上的预训练过程中,模型可以学习到语料中的语言规律、有效信息等,从而可以在生成阶段根据给定的提示输出合理的相关信息。

但是,实际应用过程中,大模型的“幻觉”现象已成为阻碍其广泛运用的关键原因。

“幻觉”现象指模型以很高的自信输出错误或不可信结果,当模型有“幻觉”时,其使用的训练数据并不能证明输出的合理性。这背后,或许和大模型复杂多样且充满错误的语料库存在关联。 国际知名分析机构Gartner在最新研报中指出:“ChatGPT的使用不能列出引用来源,其可靠性大多基于来源信息。但是这些来源可能本身是错误的、前后矛盾的。”同时,腾讯集团高级执行副总裁汤道生在某次公开演讲中也坦言道:“目前通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致模型的行业针对性与精准度不够,数据噪音大。”

由此可见,解决“幻觉”现象成为大模型发展的关键门槛,尤其是对大模型的行业应用而言,只要存在1%的偏差,都将给企业埋下风险的种子,成为落地的门槛。

在此背景下,图技术则有机会打破僵局,给出自己的正确答案。

让关联成为破局关键

如果说大模型是唤醒数据的一个重要“闹铃”,能够让企业的沉默数据通过分析释放出业务价值,那么图技术则是闹铃上的关键指针,利用结构化且有序的数据关联让沉默数据释放价值合理化,从底层赋能大语言模型变得更高效、更精准、更智能。

文中,我们首先明确图技术的概念。图技术以“点-边”为数据结构直观简洁地描述业务实体之间的复杂关联关系,以复杂关联关系的存储、查询、计算性能优化为第一设计原则,能够从图结构数据中挖掘出有价值的知识或规律来指导业务决策。

而在大模型研发和应用过程,图技术能够减少幻觉的发生。

上文已经提过大模型的应用原理大多围绕着 Transformer技术,通过训练数据来凝结成泛化的知识,进而沉淀出下一个字符。但大模型无法回忆出事实,且会生成具有错误事实的表述。

而图技术则基于图论,一种用于研究图(由顶点和边组成的数据结构)及其性质的数学理论,通过结构化的关联数据进行计算和分析。当图技术与大模型深度融合后,能够将大语言模型中的泛化知识抽象出来用于创建知识图谱,借助数据关联有效捕捉实体之间的关系,从而更深入推理、检索和分析数据之间的逻辑关系,有效提升加强大模型的知识理解、精准输出和逻辑推理能力,弥补大模型在逻辑上的漏洞,以实现大语言模型和其他生成式 AI 结果的准确性、可解释性和透明性。

客观来说,借助图技术,当前白热化的大模型竞赛将迈进下一个里程碑。

图技术将成下一轮大模型竞赛的入场券

技术的比拼看似漫长,实则瞬息即变,入局者需要手握更多可能。放眼当前大模型和图技术深度结合的国际市场,我们能够窥见一些未来。

关注国外,我们能够发现海外主流的大模型均已经开始使用图技术来管理Context和 Prompt,并将图的概念深度融合到预训练的过程当中,使传统的大模型具备更加优秀的推理、逻辑以及可解释的能力。 据了解,图数据库头部厂商Neo4j已宣布与 Google Cloud 的大语言模型Vertex AI 达成合作,企业客户能够利用Google Cloud Platform中的Neo4j产品构建知识图谱,以获得更准确、透明和可解释的生成式 AI 见解。学术领域,国外对于大模型与行业知识图谱相关论文研究也处于国际前沿。

相较于国外图技术的率先落地,国内的大模型厂商尚未在图技术领域形成大规模的投入,但是也有图技术厂商积极探索两者之间的技术结合和应用落地。

图数据库准独角兽创邻科技凭借行业领先的技术理念与实践经验率先发力,于2023年年初首发公布 “正式接入百度文心一言能力,打造图分析人工智能全系产品,以实现图智能分析”。并且在近期,创邻科技再度和华为最新发布的盘古大模型达成合作,共同推进图技术和大模型的联合发展。 据了解,创邻科技后续将深入图技术和各类大模型的结合,充分发挥国产Galaxybase图数据库的高性能、易扩展、实时性等优势,打破国内图技术和通用大模型与行业大模型的落地瓶颈。

总结

对于大模型而言,克服“幻觉”现象已成为不得不做的事,而图技术必将成为克服该挑战的关键因子。在大模型的角斗场里,和图技术的结合也将成为大模型厂商新的入场券。
如果你想了解更多创邻科技Galaxybase图技术在大模型领域的实践和成果,欢迎关注创邻科技Galaxybase公众号留言咨询,我们携手共同寻找新的大模型增长点。

猜你喜欢

转载自blog.csdn.net/qq_41604676/article/details/132152197