机器学习-向量检索+存储格式技术 - 代码天地

机器学习-向量检索+存储格式技术

其他 2018-08-17 18:13:55 阅读次数: 0

(1) 向量相似性检索

算向量相似度在很多算法中都有应用，对大规模服务来说，如何加速向量检索与相似度计算

是非常有价值的。

应用场景：

1 机器学习算法内部步骤：KNN, K-means

2 向量相似搜索：图像检索，word关键词检索

下面列出了其中的一些方式和方法：

两个问题：

- 1 检索-相似向量检索：

引用自：

http://www.flickering.cn/ads/2018/03/%E3%80%90%E8%BD%AC%E3%80%91%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%AB%98%E7%BB%B4%E6%95%B0%E6%8D%AE%E5%AE%9E%E6%97%B6%E7%9B%B8%E4%BC%BC%E6%90%9C%E7%B4%A2%E7%AE%97%E6%B3%95%EF%BC%9Aproduct-quantization/

参考文献很好的总结了相似搜索的几类方法，这里简要总结几个核心点。可以将方法分为三大类：

基于树的方法
- KD树是其下的经典算法。一般而言，在空间维度比较低时，KD树的查找性能还是比较高效的；但当空间维度较高时，该方法会退化为暴力枚举，性能较差，这时一般会采用下面的哈希方法或者矢量量化方法。
哈希方法
- LSH(Locality-Sensitive Hashing)是其下的代表算法。文献[7]是一篇非常好的LSH入门资料。
- 对于小数据集和中规模的数据集(几个million-几十个million)，基于LSH的方法的效果和性能都还不错。这方面有2个开源工具FALCONN和NMSLIB。
矢量量化方法
- 矢量量化方法，即vector quantization。在矢量量化编码中，关键是码本的建立和码字搜索算法。比如常见的聚类算法，就是一种矢量量化方法。而在相似搜索中，向量量化方法又以PQ方法最为典型。
- 对于大规模数据集(几百个million以上)，基于矢量量化的方法是一个明智的选择，可以用用Faiss开源工具。

- 2 检索成功后-向量相似度计算：

(2) 向量存储格式

稀疏矩阵存储格式

https://blog.csdn.net/wangjian1204/article/details/52149199

参考文章：

[1]火光摇曳：

[2] 图像检索：再叙ANN Search

[3] What are some fast similarity search algorithms and data structures for high-dimensional vectors?

友情推荐：ABC技术研习社

为技术人打造的专属A(AI),B(Big Data),C(Cloud)技术公众号和技术交流社群。

猜你喜欢

转载自blog.csdn.net/gao8658/article/details/81383434

机器学习-向量检索+存储格式技术

机器学习与高维信息检索 - Note 8 - 支持向量机（Support Vector Machines）

机器学习-向量化

机器学习的向量

向量检索在大模型应用场景的技术和实践

机器学习（支持向量机）

机器学习_支持向量机

【机器学习】支持向量机

机器学习——支持向量机

机器学习-支持向量机

机器学习--向量与矩阵求导

机器学习前奏--向量的创建

机器学习支持向量机

[机器学习] - 支持向量机

机器学习 —— 支持向量机

机器学习—支持向量机

机器学习之路： python 实践 word2vec 词向量技术

机器学习支持向量机学习笔记

检索技术核心学习总结

机器学习与高维信息检索 - Note 1 - 信息检索、机器学习与随机变量

机器学习---支持向量机（一）什么是支持向量机

【机器学习】函数对向量、矩阵的梯度(向量、矩阵求导)

机器学习-线性代数-向量、基底及向量空间

机器学习（二）—支持向量机SVM

机器学习系列-支持向量机

机器学习算法（8）-支持向量机

机器学习基础——支持向量机

机器学习(八)SVM支持向量机

机器学习05：支持向量机2

机器学习04：支持向量机

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)