最近邻算法调研

其他 2018-10-08 15:50:19 阅读次数: 0

无论是图像检索、视频检索还是长文本检索，只要涉及到检索，必然需要建立索引。建立索引就是预处理的过程，用空间换时间，而有时空间的节省往往能够降低时间复杂度。磨刀不误砍柴工，就像考试之前好好复习一样，先把知识缓存下来，提取知识的时候才能够更加迅速。

文本倒排索引是索引的一种，这种方式终究无法应对海量数据。

图像检索、视频检索、音频检索所使用的套路非常相近：

对内容提取特征
对特征进行压缩、规整，得到向量，相当于哈希值
查询时，对待查询视频提取特征、计算哈希，去向量库中检索

其中最后一步，拿一个向量去向量库中检索，这个问题名叫最近邻近似搜索（Approximate Nearest Neighbor，ANN）。

阿里巴巴工程师提出一种非常迅猛的算法：
Fast Approximate Nearest Neighbor Search With The Navigating Spreading-out Graph

搜索最近k个近邻的，时间复杂度接近于log N。

Annoy（Spotify开源的ANN库）的作者Erik Bernhardsson做了一个ANN-benchmarks。

建立索引之后，是否支持动态更新又是另一个问题。

平衡树、红黑树、堆等数据结构也相当于一种索引，它们都实现了增删改查。

参考资料

https://www.zhihu.com/question/280496610/answer/429491463
https://zhuanlan.zhihu.com/p/37381294
https://zhuanlan.zhihu.com/p/35760535
https://zhuanlan.zhihu.com/p/29282342
https://zhuanlan.zhihu.com/p/43972326

猜你喜欢

转载自www.cnblogs.com/weiyinfu/p/9754701.html

最近邻算法调研

TensorFlow的最近邻算法

K最近邻算法

K最近邻算法（KNN）

最近邻插值算法

k最近邻算法(kNN)

KNN（最近邻）算法总结

K最近邻：KNN算法

KNN最近邻分类算法

12、K最近邻算法（KNN算法）

机器学习（4）K最近邻算法

KNN最近邻算法python实现

对最近邻算法进行基准测试

[deeplearning-021] tf的最近邻算法

近似最近邻算法-annoy解析

KNN最近邻算法及其Python实现

K最近邻算法【更新ing】

K最近邻算法项目实战

kNN k-最近邻算法

10-K最近邻算法

图像最近邻插值算法

数据挖掘-分类算法-最近邻分类

机器学习——KNN最近邻算法

KNN-最近邻算法初探

python实现KNN（最近邻）算法

机器学习 K-最近邻算法

最近邻

图解算法第10章 k最近邻算法

【算法】K最近邻算法（K-NEAREST NEIGHBOURS，KNN）

基于KNN（K最近邻分类算法）的推荐算法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)