PostgreSQL 作为矢量数据库

介绍

在这里插入图片描述

嵌入是由人工智能模型(例如巨大的语言模型)生成的,并且由于它们包含大量属性或特征,因此管理它们的表示可能很困难。在人工智能和机器学习的背景下,这些特征代表数据的许多元素,所有这些元素对于理解模式、相关性和底层结构都是必要的。

因此,我们需要一个专门为管理此类信息而开发的专门数据库。Chroma-DB等矢量数据库能够满足这一需求,因为它们提供了经过优化的嵌入式存储和查询功能。矢量数据库具有独立矢量索引所不具备的典型数据库的特征。此外,向量数据库具有处理向量嵌入的专门能力,这是传统的基于标量的数据库所不具备的。

PostgreSQL 是一个强大的对象关系数据库系统,可在开源许可下使用。它的积极开发已超过 35 年,这帮助其在可靠性、稳健性和性能方面建立了良好的声誉。

好消息是 Postre-SQL 除了外部扩展之外还支持向量。
本文将进一步详细介绍上述内容。Azure 和 AWS 提供了一种启用此扩展的简单方法。

什么是扩展

PostgreSQL 附带了各种贡献者开发的模块和扩展。PostgreSQL 社区负责这些组件的维护。通过创建扩展,我们能够利用这些模块以及它们在 PostgreSQL 中提供的功能。PostgreSQL 扩展的功能可以将许多 SQL 对象捆绑到一个可以从数据库加载或撤回的包中。这个包也可以修改。一旦扩展被加载到数据库中,就可以执行与内置功能相同的操作。

PG向量

pgvector 是一个开源向量相似度扩展。它有助于:

搜索具有 Postgres 客户端的每种语言的精确和近似最近邻、L2 距离、内积距离和余

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/132044757