论文：Fast Learning of Temporal Action Proposal via Dense Boundary Generator - 代码天地

论文：Fast Learning of Temporal Action Proposal via Dense Boundary Generator

其他 2020-03-01 18:19:45 阅读次数: 0

引文：https://zhuanlan.zhihu.com/p/91729987
引文：https://zhuanlan.zhihu.com/p/91963727

原文：https://arxiv.org/pdf/1911.04127.pdf
code：https://github.com/TencentYoutuResearch/ActionDetection-DBG
在这里插入图片描述

三点创新，探索视频动作检测最优方案

视频动作检测技术是精彩视频集锦、视频字幕生成、动作识别等任务的基础，随着互联网的飞速发展，在产业界中得到越来越广泛地应用。视频动作检测算法需要在给出视频中找到动作发生的位置（起点和终点）和置信度。如下图所示，我们需要在一段体育视频场景中，找到“跳高”这个动作发生的起点时刻和终点时刻。

在这里插入图片描述

DBG框架结构

算法框架如下图所示，包括三个部分：视频特征抽取（Video Representation），稠密边界动作检测器（DBG），后处理（Post-processing）。框架图如下：
在这里插入图片描述

与现有的视频动作检测算法相比，DBG算法有3点创新：

（1）提出一种快速的、端到端的稠密边界动作生成器(Dense Boundary Generator，DBG)。该生成器能够对所有的动作提名（proposal）估计出稠密的边界置信度图。

（2）引入额外的时序上的动作分类损失函数来监督动作概率特征，该特征能够有利于回归动作的完整度。

（3）设计一种高效的动作提名特征生成层，该层能够有效捕获动作的全局特征，便于后面的分类和回归模块。

据了解，DBG算法在全球两大权威视频动作数据集ActivityNet-1.3和THUMOS14上均取得了第一。算法的整体框架主要包括三个部分：视频特征抽取（Video Representation），稠密边界动作检测器（DBG），后处理（Post-processing）。

DBG实验

在这里插入图片描述

在这里插入图片描述

发布了97 篇原创文章 · 获赞 222 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_32642107/article/details/103432168

论文：Fast Learning of Temporal Action Proposal via Dense Boundary Generator

Boundary-Sensitive Network for Temporal Action Proposal Generation

BMN: Boundary-Matching Network for Temporal Action Proposal Generation【文章分析与理解】

CTAP: Complementary Temporal Action Proposal Generation

TAN: Temporal Aggregation Network for Dense Multi-label Action Recognition

【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

论文翻译：Ensemble Deep Learning for Skeleton-based Action Recognition using Temporal Sliding LSTM networ

Inductive Representation Learning In Temporal Networks via Causal Anonymous Walks

Single Shot Temporal Action Detection 论文介绍

论文笔记之《Cell Tracking via Proposal Generation and Selection》

《Action recognition by dense trajectories》论文笔记

Learning hierarchical spatio-temporal features for action recognition with ISA

ICCV2021：TextBPN——《Adaptive Boundary Proposal Network for Arbitrary Shape Text Detection》论文阅读笔记

FastGCN： fast learning with graph convolutional networks via importance sampling 论文详解 ICLR 2018

LADCF目标跟踪算法学习笔记（Learning Adaptive Discriminative Correlation Filters via Temporal Consistency prese）

SST:Single-Stream Temporal Action Proposals论文笔记

论文笔记（四）：Temporal Action Localization by Structured Maximal Sums

【Spatial-Temporal Action Localization（四）】论文阅读2019年

【Spatial-Temporal Action Localization（六）】论文阅读2021年

论文Action Genome: Actions as Composition of Spatio-temporal Scene Graphs

【Spatial-Temporal Action Localization（二）】论文阅读2017年

【Spatial-Temporal Action Localization（七）】论文阅读2022年

【Spatial-Temporal Action Localization（三）】论文阅读2018年

迁移学习论文阅读：Transfer Learning via Learning to Transfer

【论文下饭】Temporal Graph Network for Deep Learning on Dynamic Graphs

LPAT: Learning to Predict Adaptive Threshold for Weakly-supervised Temporal Action Localization [Paper Reading]

【自监督论文阅读笔记】Unsupervised Learning of Dense Visual Representations

视频去模糊论文阅读-Online Video Deblurring via Dynamic Temporal Blending Network

论文阅读：Deep Metric Learning via Lifted Structured Feature Embedding

论文-《Towards Optimal Binary Code Learning via Ordinal Embedding》

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

Java中关于时间的操作及格式化

《HTML5与CSS3基础教程》第五章学习笔记图像

nginx下安装PHP发生问题的逐步解决

HDU-1048，The Hardest Problem Ever（字符串处理）

新一代多媒体技术与应用的部分课后题

Shader 绘制特殊图形

Oracle数据库三种备份方案

CodeForces - 983B XOR-pyramid(两次区间DP/记忆化DFS)

Python3基础语法——变量与运算符

（转载）KMP算法详解（原创）详解KMP算法

每日归档

更多

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)