Faiss笔记

业界资讯 2023-08-18 20:34:28 阅读次数: 0

Faiss

业务流框架

图来自Billion-scale semantic similarity search with FAISS+SBERT

代码结构

没有public和private，即成员可以直接访问

在这里插入图片描述

两个思考点

为了提高召回率，精度和速度，内存使用，有2个思考维度入手：

向量处理技术
索引技术（ IVF, PQ, or HNSW）

先看向量处理技术

在这里插入图片描述

距离（度量标准）

PAC降维

PQ量化

Faiss中使用的乘积量化是Faiss的作者在2011年发表的论文，参考：《Product Quantization for Nearest Neighbor Search》

Index类型

倒排索引

理解倒排索引的概念什么是倒排索引？
倒排索引为什么叫倒排索引？书的目录

Run on GPU

Tips

关于cosine距离：Faiss中的PQ目前还都是基于L2距离（欧式距离），并不支持cosine距离；

关于源代码阅读：可以从AutoTone.cpp这个文件开始阅读；

关于矩阵计算框架：Faiss外部依赖只有一个矩阵计算框架，这个框架可以用OpenBlas也可以用Intel的MKL，使用MKL编译的话性能会比OpenBlas稳定提升30%，在发布Faiss的时候MKL还是商用License，所以官方并没有直接使用，但是现在MKL已经免费了，所以建议使用MKL；

关于OpenMP：Faiss内部实现使用了大量的OpenMP来提高计算效率，其默认的向量检索也是batch，如果应用场景是单条向量查询，建议把环境变量OMP_NUM_THREADS设为1，避免使用OpenMP带来的多余性能开销，这样可以将单条查询的latency减少至原本的20%；

默认返回的结果是有可能重复的：要想保证结果不重复就在IndexPQ.cpp:927中MinSumK <float, SemiSortedArray, false>中把第三个参数改成true。

参考

Understanding FAISS

猜你喜欢

转载自blog.csdn.net/u010006102/article/details/122927657

Faiss笔记

FAISS

机器学习笔记 - Facebook AI Similarity Search（Faiss）简介

Faiss安装

Faiss相关

安装faiss

Faiss教程：基础

Faiss教程：索引(2)

Faiss教程：索引(1)

Faiss教程：GPU

Faiss教程：入门

faiss简介及示例

faiss安装教程

Faiss流程与原理分析

linux下安装Faiss

faiss相似搜索原理

Faiss源码安装

faiss 安装教程

python如何安装faiss

faiss安装遇到的问题

faiss-gpu的问题

faiss的python接口使用

Langchain 集成 FAISS

Faiss简单使用

faiss windows 安装使用

【faiss报错】faiss.cast_integer_to_idx_t_ptr

安装faiss 报错：找不到满足要求 faiss 的版本

facebook Faiss的基本使用示例

基于gRPC的Faiss server实践

Faiss介绍以及使用详解

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)