KNN的优化算法4：LSH

其他 2018-08-14 10:08:50 阅读次数: 0

LSH：针对海量、高维数据的NN搜索提出来的。一般相似图像搜索、网页搜索用的比较多。

使用LSH进行对海量数据建立索引（Hash table）并通过索引来进行近似最近邻查找的过程如下：

1. 离线建立索引

（1）选取满足(d1,d2,p1,p2)-sensitive的LSH hash functions；

（2）根据对查找结果的准确率（即相邻的数据被查找到的概率）确定hash table的个数L，每个table内的hash functions的个数K，以及跟LSH hash function自身有关的参数；

（3）将所有数据经过LSH hash function哈希到相应的桶内，构成了一个或多个hash table；

2. 在线查找

（1）将查询数据经过LSH hash function哈希得到相应的桶号；

（2）将桶号中对应的数据取出；（为了保证查找速度，通常只需要取出前2L个数据即可）；

（3）计算查询数据与这2L个数据之间的相似度或距离，返回最近邻的数据；

猜你喜欢

转载自blog.csdn.net/weixin_41770169/article/details/81634943

KNN的优化算法4：LSH

KNN算法及KNN的优化算法-加权KNN

KNN算法优化

LSH之simHash算法

LSH

KNN的优化算法2：KD-tree

KNN的优化算法3：Ball-tree

KNN的优化算法1：距离加权

Halcon4：KNN算法及halcon例程

机器学习（4）-- KNN算法应用

最近邻和K近邻及其优化算法LSH（局部敏感哈希，Locality Sensitive Hashing） Kd-Tree

KNN分类 KNN算法

knn算法

KNN 算法

KNN的优化算法2：KD-tree（2）

4-4 算法优化

机器学习笔记4 - K-最近邻算法（KNN）

文本相似性计算--MinHash和LSH算法

算法：KNN算法

KNN算法和Kernel KNN算法的区别

KNN最近邻节点算法分类回归预测基础算法、优化方案及python代码实现

基于lsh的增量学习分类器、海量数据分类处理复杂度O(1)准确度超越KNN

自己实现KNN算法

KNN算法实践3

KNN算法详解

Python: KNN算法的实现

knn算法理解

python 实现KNN算法

大数据-KNN算法

kNN算法python实现

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)