向量检索（二）Faiss 不同索引的性能 - 代码天地

向量检索（二）Faiss 不同索引的性能

企业开发 2023-04-06 15:25:47 阅读次数: 0

IVF + Flat 索引的性能

sift1m 数据集合，指定 nlist 为 16384，对搜索的性能做测试，
机器环境： Mac Pro 2020, Intel, 16G 内存

index = faiss.index_factory(d, "IVF16386,Flat")
index.train(xb)
index.add(xb)

index.nprobe = 256
D, I = index.search(xq, k)
recall(I)

nprobe = 256时，不论取 nlist = 16384, 还是 nlist = 4096， recall 都接近1，响应时间 < 4ms 单个请求。

nprobe	Recall	Search Time
1	0	1.55ms
16	1.0	1.48ms
128	1.0	2.46ms
256	1.0	3.43ms

这是每次执行单个搜索请求的性能。当一次执行多个向量（一次检索100个，10000个 query）的检索时，整体的耗时变化不大。 faiss 并行检索的性能非常好。

sfit1m 的数据集， IVF Flat 的索引大约为 520M，创建索引的时间约为 5 分钟。

参考：
https://github.com/facebookresearch/faiss/issues/23
http://ann-benchmarks.com/index.html
https://github.com/facebookresearch/faiss/wiki/Indexing-1M-vectors

IVF + HNSW 索引的参数与性能

IVF 索引，聚类的中心点数量建议设置在 4096 以上。

1 million 的数据索引，推荐设置 nlist 值为 65536，这种情况下需要 30*nlist == 1.97M 的向量来传入到 index.train 做训练。

就 sift1m 128维度的数据来说，对于 IVF+HNSW 的索引，由于数据量不够 1.97M，使用 nlist=4096能够得到一个很好的召回率。

index = faiss.index_factory(d, "IVF4096_HNSW32,Flat")
index.train(xb)
index.add(xb)

D, I = index.search(xq, k)
recall(I)

%%timeit
index.search(xq, k)

index.nprobe = 146
D, I = index.search(xq, k)
recall(I)

%%timeit
index.search(xq, k)

不同的 nprobe 跑出来的 recall 和搜索耗时（1million sift1m 数据）

HNSW 有很好的召回和检索性能，缺点是内存消耗大。 Sift1M 128维的数据集，索引大小约在 523M+，内存耗用大约也是这个大小。

Index (nprobe = 64)	Recall	Search Time	Memory
`IVF4096_HNSW,Flat`	90%	550µs	523MB
`IVF4096_HNSW,PQ32` (PQ)	69%	550µs	43MB
`OPQ32,IVF4096_HNSW,PQ32` (OPQ)	74%	364µs	43MB

不同索引类型的召回率

扫描二维码关注公众号，回复： 14591627 查看本文章

从图中可以看出来，当 nprobe 设置为 150 左右时，IVF4096, HNSW32 的召回率为 1。

参考：
https://www.pinecone.io/learn/composite-indexes/
https://www.pinecone.io/learn/hnsw/

猜你喜欢

转载自blog.csdn.net/davidullua/article/details/127753913

向量检索（二）Faiss 不同索引的性能

[python] 向量检索库Faiss使用指北

基于SimCSE和Faiss的文本向量检索实践

android NDK编译openblas和向量检索库faiss

分布式向量检索引擎

LLM之高性能向量检索库

高性能索引策略二

MySQL性能优化（二）索引

Chat with Milvus #12 ：新版本、Postgres向量检索插件、比Faiss好用？

向量检索（一）Faiss 在工业界的应用和常见问题解决

使用Spark ALS模型 + Faiss向量检索实现用户扩量实例

faiss学习（二）另外两种基础索引，保存索引

Faiss教程：索引(2)

Faiss教程：索引(1)

【向量数据库】相似向量检索Faiss数据库的安装及余弦相似度计算（C++）

Sphinx : 高性能SQL全文检索引擎

SQL SERVER索引优化系列之二：索引性能考虑

不同的核函数对支持向量机分类性能的影响

Mysql性能优化二：索引优化

MySQL性能优化（二）索引优化

高性能MySQL实战（二）：索引

【LangChain】向量存储之FAISS

faiss入门+使用的索引原理

不同索引类型对Postgresql查询性能的影响(单一索引，覆盖索引，Hash索引)

MYSQL的全表扫描，主键索引(聚集索引、第一索引)，非主键索引(非聚集索引、第二索引)，覆盖索引四种不同查询的分析

语义检索系统【三】：基于Milvus 搭建召回系统抽取向量进行检索，加速索引

faiss之特征检索与聚类算法

火山引擎ByteHouse：如何为OLAP设计高性能向量检索能力？

Faiss向量相似性搜索

向量数据库Faiss的搭建与使用

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)