最近邻搜索神器——一文读懂局部敏感哈希LSH原理

其他 2020-08-04 07:26:07 阅读次数: 0

什么是LSH?

LSH主要用来解决高维空间中点的近似最近邻搜索问题,即Approximate Nearest Neighbor(ANN)。
在实际的应用中我们所面对的数据是海量的,并且有着很高的维度。在对数据的各种操作中,查询操作是最常见的一种,这里的查询是指输入一个数据,查找与其相似的数据,那么怎样快速从海量高维数据中找到与某个数据最相似的数据,成为了一个难点。

传统的哈希算法通过哈希函数建立哈希表,由哈希表我们能够得到O(1)的查找时间性能,传统哈希算法的关键在于,找到合适的哈希函数,将原始数据映射到相对应的桶内,如果不同的数据,映射到了同一个位置就是发生了冲突,这是传统哈希算法所避免的。

局部敏感哈希(LSH)的想法恰恰和传统的哈希算法相反,我们渴望冲突,但是我们希望的是原先相邻的两个数据能够以较高的概率被映射为同一个哈希值,而相似对很低的数据以极低的概率映射成同一个哈希值.这样的函数我们叫LSH。

LSH最根本的作用就是能够高效的处理海量高维数据的最近邻问题,其最大的特点就是保持数据的相似性。

一个不满足LSH的简单例子。

假设一个哈希函数 $\% 9$

猜你喜欢

转载自blog.csdn.net/HowardEmily/article/details/107192481

最近邻搜索神器——一文读懂局部敏感哈希LSH原理

局部敏感哈希LSH

最近邻和K近邻及其优化算法LSH（局部敏感哈希，Locality Sensitive Hashing） Kd-Tree

一文尽览近似最近邻搜索中的哈希与量化方法

局部敏感哈希（LSH）资料（附链接）

一文读懂K近邻法

局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍

局部敏感哈希(lsh)包安装成功

一文读懂Synchronized的实现原理

一文读懂CPU缓存原理！

一文读懂 Kubernetes APIServer 原理

一文读懂CDN加速原理

一文读懂 Nacos 实现原理...

一文读懂keepalive的工作原理

一文读懂｜RDMA原理

【机器学习课程-华盛顿大学】：4 聚类和检索 4.2 LSH局部敏感哈希

大数据下的相似度计算方法——Uber实践基于局部敏感哈希LSH

局部敏感哈希LSH（Locality-Sensitive Hashing）——海量数据相似性查找技术

图像检索(6)：局部敏感索引(LSH)

一文读懂区块链技术逻辑和原理

一文读懂通信系统的均衡原理(时域均衡)

一文读懂Zookeeper原子广播原理（转）

一文读懂线程池实现原理

一文读懂语音识别技术原理

一文读懂自动微分（ AutoDiff）原理

一文读懂BERT(原理篇)

一文读懂 CDN DNS原理及其解析过程

一文读懂视频编解码原理

一文带你读懂Hbase概念、架构及原理

一文读懂——TCP&UDP原理

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)