SVDNet for Pedestrian Retrieval - 代码天地

SVDNet for Pedestrian Retrieval

其他 2020-04-09 10:24:42 阅读次数: 0

行人重识别之特征向量正交化

SVDNet for Pedestrian Retrieval

原文链接：https://arxiv.org/pdf/1703.05693.pdf

这篇文章的核心思想如下：

虽然特征向量的维度不小（一般为2048），但是网络经过训练后，特征向量往往是高度相关的，降低了特征向量的表达能力，进而降低了REID的性能。所以，如果能够对特征向量进行去相关（正交化），提升特征向量的表达能力，那么REID的性能便会随之提升。

首先，通过文中的例子直观感受一下，特征向量高度相关的后果。
在这里插入图片描述
经过左侧三类图片的训练，特征向量的三个维度分别表示红、粉、蓝。红色和粉色的相关性就比较高。在对右侧两幅图片进行表示时，虽然二者对于蓝色向量的差别较大，但是两者关于红色和粉色向量的差别很小，所以导致两者最后的特征向量差距很小。这便是特征向量高度相关的恶果。

其次，介绍一下网络结构和训练方法。

在这里插入图片描述
在全连接层后面增加Eigenlayer(一般在倒数第二个全连接层后面，因为加在最后一个全连接层后面，训练很难拟合)，这一层完全是线性操作，对输入向量进行奇异值分解，输出正交的特征向量（彩色部分），再将该向量输入到全连接层，进行分类。

训练过程如下：
在这里插入图片描述

在反复迭代后，Eigenlayer就做到了和原网络融为一体。而且Eigenlayer的存在也使得输入Eigenlayer的特征向量的表达能力不断提升。

最后，定量看一看特征向量正交程度和性能之间的关系。

在这里插入图片描述
粉线是衡量特征向量正交性的变量，越大代表正交性越好。可以看出，随着迭代的进行，正交性越来越好，性能也随之提高。

总结：大三的时候一个中科院博士生曾经对我说过，当你做的越来越多，越来越深入，你会发现CV其实是一个玩数学的东西，很多大佬都是数学非常6的。这篇文章或许给了我们一些启发，有时候直接从数学原理（比如本文的奇异值分解）出发，或许真的会有巨大的提升。

完

欢迎讨论欢迎吐槽

嘻嘻哈哈yjy

发布了38 篇原创文章 · 获赞 142 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_39417323/article/details/88840939

SVDNet for Pedestrian Retrieval

SVDNet for Pedestrian Retrieval：CNN到底认为哪个投影方向是重要的？

【Person Re-ID】GLAD: Global-Local-Alignment Descriptor for Pedestrian Retrieval

论文阅读笔记（三）【AAAI2017】：Learning Heterogeneous Dictionary Pair with Feature Projection Matrix for Pedestrian Video Retrieval via Single Query Image

行人重识别：SVDNet行人检索

行人重识别：SVDNet论文详解

Caltech Pedestrian Detection Benchmark

Information Retrieval

Image Retrieval

instance retrieval

行人检测(Pedestrian Detection)资源

Information Retrieval Resources

Cross-media Retrieval

Cross-modal Retrieval

Phase retrieval交替投影

Public Key Retrieval is not allowed

Video Index And Retrieval

Learning to Rank for Information Retrieval

information retrieval (CMU 11642)

Video Retrieval文献汇总

Pedestrian Identification (2) ——研究现状总结

WIDER FACE AND PEDESTRIAN CHALLENGE - WIDER CHALLENGE

Apply GPS to Estimate Pedestrian Route Choice Preference

论文解读《Comparing bicycling and pedestrian mobility》（一）

解析SCUT FIR Pedestrian Dataset数据

SVN Retrieval of mergeinfo unsupported - Reposted

image retrieval（sift+bow）

whether logo retrieval will block the application

Public Key Retrieval is not allowed错误

JDBC报错 Key Retrieval is not allowed

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)