VLAD - Vector of Locally Aggregated Descriptors - 局部聚合描述子向量 - 原理简述

局部聚合描述子向量(Vector of Locally Aggregated Descriptors,VLAD)是一种编码方法,被广泛应用到计算机视觉的许多课题中,例如图像检索和场景识别。
假设是 { x t R d } t = 1 m 输入的一幅图像的局部描述子向量的集合, { d i R d } i = 1 K 是已经学习得到的码本,则该图像的VLAD编码为:

V = [ v 1 T , v 2 T , . . . v K T ] T

其中 v i = x t d i d i x t x t d i 表示 d i 是距离 x t 最近的码字。
最终得到的VLAD编码是 K d × 1 的向量。

猜你喜欢

转载自blog.csdn.net/whwan11/article/details/80693907