VLAD算法简介图像检索 - 代码天地

VLAD算法简介图像检索

其他 2020-03-15 21:33:15 阅读次数: 0

1.1 vlad基础概念

VLAD是vector of locally aggregated descriptors的简称，是由Jegou et al.在2010年提出，其核心思想是aggregated(积聚)，主要应用于图像检索领域

1.2 相关方法优缺点

在深度学习时代之前，图像检索领域以及分类主要使用的常规算法有BoW、Fisher Vector及VLAD等。

BoW方法的核心思想是提取出关键点描述子后利用聚类的方法训练一个码本，随后每幅图片中各描述子向量在码本中各中心向量出现的次数来表示该图片，该方法的缺点是需要码本较大；FV方法的核心思想是利用高斯混合模型(GMM)，通过计算高斯混合模型中的均值、协方差等参数来表示每张图像。该方法的优点是准确度高，但缺点是计算量较大。

1.3 VLAD算法

VLAD算法可以看做是一种简化的FV，其主要方法是通过聚类方法训练一个小的码本，对于每幅图像中的特征找到最近的码本聚类中心，随后所有特征与聚类中心的差值做累加，得到一个k*d的vlad矩阵，其中k是聚类中心个数，d是特征维数(如sift是128维),随后将该矩阵扩展为一个(k*d)维的向量，并对其L2归一化，所得到的向量即为VLAD。关于该算法为何有效，Jegou et al.在2012年的期刊版本Aggregating local image descriptors into compact codes中有着相关证明。

1.4 VLAD算法发展演变

在VLAD算法的基础上Arandjelovic et al.在 All about VLAD 一文中提出了一种改进方法。随后，其又结合深度卷积神经网络的相关内容，提出了NetVLAD。

2 VLAD算法流程

(1) 读取图片文件路径及特征提取

(2) 使用聚类方法训练码本

(3) 将每张图片的特征与最近的聚类中心进行累加

*(4) 对累加后的VLAD进行PCA降维并对其归一化

*(5) 得到VLAD后，使用ADC方法继续降低储存空间和提高搜索速度

其中步骤4、5可选，在步骤3得到残差累加向量后进行L2归一化即可用欧氏距离等计算两张图片的相似性从而实现图片检索

一个简单的实现(基于sift特征及orb特征)请参考

VLAD-ORB-C++ https://github.com/Lithogenous/VLAD-ORB-Cpp

VLAD-SIFT-python https://github.com/Lithogenous/VLAD-SIFT-python

种花家的奋斗兔

发布了204 篇原创文章 · 获赞 71 · 访问量 8万+

私信关注

猜你喜欢

转载自blog.csdn.net/IT_flying625/article/details/104885986

VLAD算法简介图像检索

VLAD算法简介

图像检索简介--笔记

图像检索算法 TODO

【图像检索--感知哈希算法】

图像检索：几种基于纹理特征的图像检索算法

图像检索：基于形状特征的算法

LIRe提供的图像检索算法的速度

图像检索：CNN对Hash组算法的颠覆

Bag of Features (BOF)图像检索算法

图像检索传统算法学习笔记

图像检索Image Retrieval相关算法汇总

图像检索基于形状特征的算法

毕业设计之 --- 图像检索算法

基于内容的图像检索系统常用特征简介

图像检索：FCTH（Fuzzy Color and Texture Histogram）算法

图像检索：CEDD（Color and Edge Directivity Descriptor）算法

【大规模图像检索的利器】Deep哈希算法介绍

增强旋转不变ＬＢＰ算法及其在图像检索中的应用

大规模图像检索的利器--Deep哈希算法

图像检索

BOF、FV、VLAD算法浅析

基于TensorFlow的二进制哈希图像快速检索算法复现

基于感知哈希算法的相似图像检索技术及java代码实现

AI：02-基于深度学习的动物图像检索算法的研究

图像检索：基于内容的图像检索技术

图像检索-评价指标

图像检索文献翻译

图像检索综述

基于内容的图像检索

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)