人脸跟踪：Detect to Track and Track to Detect - 代码天地

人脸跟踪：Detect to Track and Track to Detect

其他 2018-07-12 16:21:22 阅读次数: 0

github：https://github.com/feichtenhofer/detect-track

本文概览

本文使用一个简单的卷积网络模型（ConvNet）在视频序列中同时实现多目标的跟踪和检测；
本文构建了一个新颖的损失函数，包括用于单帧检测的多任务损失和用于多帧间跟踪回归损失；
本文引入相关特征用于代表同一目标在不同帧图片中同时出现以此达到跟踪的目的；
本文检测和跟踪相互辅助，同时产生高精度的检测和跟踪性能；
本文提出在多帧中同时进行目标检测和跟踪任务，其中检测部分使用R-FCN框架，跟踪部分则将基于相关和回归的跟踪思想融入到上述检测框架中；
本文网络在ImageNet VID上进行训练和检测，网络结构简单且得到了当前最好的实验效果；

相关工作

当前在视频中实现跟踪和检测的大部分方法都是基于tracking by detection的思路，即检测器检测目标，然后用跟踪器跟踪目标，当跟踪可信度较低时，用检测器辅助捕获目标，这种跟踪检测框架主要被基于单帧的目标检测方法所支配；
由于各种视频数据库（典型的为VID数据库）的出现，基于视频的目标检测方法备受关注，不用于tracking by detection框架，为视频中跟踪和检测问题提供了另一种解决思路；
VID数据库特点：数据量大（共高达130W张图片），运动模糊的图像多（更接近真实情况），分辨率低（视频中的图片往往比静态图片分辨率低），存在大量目标被遮挡的情况且目标姿态丰富（可以提高算法的鲁棒性）；
当前在VID数据库上实现视频跟踪检测的绝大部分性能好的算法基本都附带复杂的后处理过程；
本文选用R-FCN为主体框架，R-FCN优点：全卷积结构，速度快分辨率高适合跟踪任务；
本文跟踪部分思想借鉴于Fully-convolutional Siamese跟踪框架和100 FPS deep regression跟踪网络；
新视频目标检测数据集：A Large High-Precision Human-Annotated Data Set for Object Detection in Video (2017) 每个图片中仅有一个物体标注；

本文算法框架概览

使用end-to-end的方式训练用于同时进行跟踪和检测的全卷积网络；
损失函数为多任务损失函数，由跟踪损失和检测损失构成；
主体网络采用ResNet-101网络，网络输出为多帧图片，提取出的特征为检测和跟踪共享；
为实现跟踪，在ResNet-101的不同尺度特征层进行帧间特征的交叉相关操作，即第t帧的第n，n+1,n+2层特征分别于第t+N帧的第n，n+1,n+2层特征做相关计算；
检测部分，在最终特征层使用ROI Pooling特征进行分类和bbox回归操作；
跟踪部分，在最终相关后的特征层使用ROI Pooling特征进行帧间的bbox变化回归估计；
实验表明，加入跟踪loss后可以提升特征学习质量，更有利于目标的检测；
扩大帧间隔后，可实现视频中快速目标跟踪检测；

本文网络结构

这里写图片描述

这里写图片描述

多帧输入，ResNet-101主干结构，R-FCN检测网络，跟踪检测共享卷积特征；
损失=检测分类损失+检测回归损失+跟踪回归损失；
RoI Pooling：同R-FCN一样，结合RPN+position-sensitive score map，得到目标类别得分和bbox回归值
RoI Tracking：输入为两帧特征（包括卷积中间层和position-sensitive score map）的相关操作后的结果，通过RPN（使用第t帧的RPN）指示经过RoI Tracking输出坐标变换关系；
网络改变：同R-FCN相同，对ResNet-101中conv5的stride由2改为1，同时使用dilated convolution方法增加感受野；
损失函数：

这里写图片描述

相关滤波跟踪：不用于经典的用于单目标跟踪的相关滤波操作，本文的相关滤波操作在多目标上进行，在特征图上所有可能的位置计算相关图；

猜你喜欢

转载自blog.csdn.net/wfei101/article/details/80977319

人脸跟踪：Detect to Track and Track to Detect

Detect to Track and Track to Detect

D&T（Detect to Track and Track to Detect）论文详读

Detect-and-Track论文：笔记

Detect-and-Track论文：中文翻译

track

目标跟踪-object track

论文阅读笔记8——Track to Detect and Segment:An Online Multi-Object Tracker(TraDeS)

Features Track

face track

Detect-and-Track论文：3D Mask R-CNN Caffe2源代码解析——2.ResNet18_3D解析

Detect-and-Track论文：3D Mask R-CNN Caffe2源代码解析——4. 网络头解析

Detect-and-Track论文：3D Mask R-CNN Caffe2源代码解析——3.RPN&FPN构建

电子邮件的打开跟踪(open track)和链接点击跟踪(link track)的原理

CoTracker跟踪器 - CoTracker: It is Better to Track Together

Track的用户权限管理

Back track入门

Air Track Mat

Face alignment track

track-by的使用

Features Track (STL瞎搞)

NOIP模拟 track

Track Direction(追踪方向)

uva 11646 - Athletics Track

Features Track[STL map]

Learning to Track Any Object

Using LNT to Track Performance

Timeline的Animation Track详解

spring标签 @Resource 出错的track

track user changes in customized table

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)