Recurrent Filter Learning for Visual Tracking - 代码天地

Recurrent Filter Learning for Visual Tracking

其他 2019-05-29 09:58:27 阅读次数: 0

Contribution

提出一个新颖的recurrent filter learning 框架从而去捕捉空间与时间信息，并且不要求在线fine-tune(on tracking)
设计一个高效有效的初始化和更新target appearance 方法，具体而言就是conv LSTM作为记忆单元更新目标表观

网络结构

从groundtruth来crop object exemplar \(E_{t}\)(127 * 127 * 3)经过E-CNN(exemplar feature extractor),得到exemplar feature\(e_{t}\)(6 * 6 * 256),作为conv-LSTM的输入，conv-LSTM接收\(e_{t}\),还接受上一个状态的hidden state \(h_{t-1}\)和cell state \(c_{t-1}\),产生当前状态的hidden state \(h_{t}\)(6 * 6 * 1024)和cell state \(c_{t}\)(6 * 6 * 1024), 产生的hidden state \(h_{t}\) 经过output layer(1 * 1 * 256的卷积核) 产生 object filter \(f_{t}\) (6 * 6 * 256)，在下一帧的Search image \(S_{t+1}\)(255 * 255 * 3)经过 S-CNN 特征提取之后得到Search image feature(22 * 22 * 256)进行correlation 操作（实际是卷积）得到响应映射\(R_{t}\)（17 * 17）

S-CNN 与E-CNN

S-CNN 与E-CNN参数是不同的（实验证明这样的效果是最好的），卷积网络结构是相同的网络如图
在这里插入图片描述
conv 之后都有用BatchNormalization加速网络收敛，除了Conv-5 ，都用激活函数ReLu

convolutional LSTM 的结构

在这里插入图片描述
结构与原始的LSTM结构相似，只不过sigmod前面加了卷积层（3 * 3 filter）,保存图像的空间结构

初始化cell state \(c_{0}\)，hidden state \(h_{0}\)第一帧的exemplar 用E-CNN提取\(e_{0}\)再用（3* 3 *1024）conv filter 进行的卷积在经过tanh 初始化完成。

loss fuction

在这里插入图片描述

Training Details

mini-batchSize是长度为10的10个视频剪辑, 数据增广，随机干扰色，图片镜像变换，拉伸等，

Online tracking

我们没有用BBox regression,而是用bicubic 插值做，选择最大值位置作为目标位置，并构建尺度金子塔
\(R^{m}(f_{t},s_{t+1}) = f_{t}*s_{t+1}^m\)
\(v^m\)是 response map \(R^m\)在尺度m上的最大值.
找到\(v^m\)最大的那个尺度
在尺度m 上求出前k个score的平均位置，
\(p^{*}=\frac{1}{K}\sum\limits_{k}^{K}{p_{k}}\)

猜你喜欢

转载自www.cnblogs.com/Zak-NoS/p/10941822.html

Recurrent Filter Learning for Visual Tracking

Particle filter for visual tracking

CREST: Convolutional Residual Learning for Visual Tracking

Deep Reinforcement Learning with Iterative Shift for Visual Tracking

《Deep Learning for Visual Tracking: A Comprehensive Survey》

Paper Reading - Learning a Recurrent Visual Representation for Image Caption Generation

Correlation Filter in Visual Tracking系列一：Visual Object Tracking using Adaptive Correlation Filters

ROLO：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking（一）

ROLO：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking（二）

Re3 : Real-Time Recurrent Regression Networks for Visual Tracking of Generic Objects

CFNet：End-to-end representation learning for Correlation Filter based tracking

DSiam阅读笔记：Learning Dynamic Siamese Network for Visual Object Tracking

论文《Learning regression and verification networks for long-term visual tracking》

Learning Background-Aware Correlation Filters for Visual Tracking ICCV 2017

论文笔记：Learning Attribute-Specific Representations for Visual Tracking

recurrent model for visual attention

目标跟踪（一）：Visual Object Tracking using Adaptive Correlation Filters(MOSSE Filter)

【小白笔记】CFNet：End-to-end representation learning for Correlation Filter based tracking

SiamRN：Learning to Filter: Siamese Relation Network for Robust Tracking模型结构和代码解读

目标跟踪（二）：Learning Background-Aware Correlation Filters for Visual Tracking.(ICCV2017,BACF)

论文阅读：MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

Learning Multi-Domain Convolutional Neural Networks for Visual Tracking 论文笔记

Visual Tracking with Online Multiple Instance Learning (MIL)目标跟踪论文笔记

C-COT：Learning Continuous Convolution Operators for Visual Tracking程序问题

CVPR2018读文笔记：VITAL：VIsual Tracking via Adversarial Learning

ICCV2017跟踪算法BACF的配置（Learning Background-Aware Correlation Filters for Visual Tracking）

CVPR2018跟踪算法 STRCF的配置（Learning Spatial-Temporal Regularized Correlation Filters for Visual Tracking）

ICCV2015跟踪算法SRDCF的配置（Learning Spatially Regularized Correlation Filters for Visual Tracking）

【计算机视觉】《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》

【小白笔记】目标跟踪VIVAT(Visual Tracking via Adversarial Learning)论文笔记

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)