《Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks》算法详解 - 代码天地

《Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks》算法详解

企业开发 2023-04-08 13:34:01 阅读次数: 0

论文: Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks
官方代码(caffe): https://github.com/ZhaofanQiu/pseudo-3d-residual-networks
非官方(pytorch): https://github.com/qijiezhao/pseudo-3d-pytorch
由微软和中科大提出
被ICCV2017收录

一、核心创新

提出将3D卷积进行时间和空间的拆分来代替一个3D卷积
提出了几种变形的残差块
提出了P3D(Presudo-3D) ResNet

二、P3D Blocks和P3D ResNet

2.1 3D卷积解耦

3D卷积是同时提取空间信息和时间信息。拿核大小为3 x 3 x 3大小的3D卷积核来说，可以将其自然的解耦为一个1 x 3 x 3大小的卷积核和一个3 x 1 x 1大小的卷积核的组合。解耦的3D卷积称为伪(Pseudo)3D卷积。

2.2 Pseudo-3D Blocks

思想是将3D CNN按照2.1里面的解耦思想改造成P3D CNN，但是需要考虑两点：

时间维度和空间维度的计算是否需要直接或者间接的互相关联
两种维度的计算是否需要直接与输出关联

基于这两点考虑设计出下面三种P3D CNN：
在这里插入图片描述

又基于上面的三种链接的CNN和原始ResNet Block，提出下列三种P3D Block：
在这里插入图片描述

2.3 Pseudo-3D ResNet

为了检验那种P3D Block效果好，进行如下实验：

对于原始的ResNet，使用UCF101视帧进行finetune，输入图片从resized为240 x 320的视频帧中随机截取240 x 240，固定除去第一层BN后的所有BN参数，并且最后加入了droprate为0.9的dropout操作
对于原始的ResNet，测试时对每一帧进行预测，然后算平均值
其它的三类P3D ResNet参数初始化使用上一步训练好的参数
P3D ResNet的输入为16 x 160 x 160，来源于从视频中截取不重叠的视频段16 x 182 x 242中随机截取
输入片段随机水平翻转
batch为128
SGD，lr初始为0.001，每迭代3k除以10，迭代7.5k
其它的三类P3D ResNet测试结果计算方法没提

在这里插入图片描述

为了使得P3D Block在网络中多样，文章简单的按照P3D-A→P3D-B→P3D-C顺序进行block替换这种网络就称为P3D ResNet，实验结果在上面表中也有显示。
在这里插入图片描述
其他具体的参数和实验结果详情可以看原文和代码。

视频算法QQ交流群：657626967

猜你喜欢

转载自blog.csdn.net/liuxiaoheng1992/article/details/119522284

《Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks》算法详解

【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

Pseudo-3D Residual Networks算法的pytorch代码

论文学习：Learning spatio-temporal features with 3D convolutional networks

Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction

Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction论文笔记

【AAAI 2017】Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction

STGCN:Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecastin

【IEEE TDKE 2020】Flow Prediction in Spatio-Temporal Networks Based on Multitask Deep Learning

ICCV2021跟踪算法Stark的配置（Learning Spatio-Temporal Transformer for Visual Tracking）

Adversarial Spatio-Temporal Learning for Video Deblurring

Learning Spatial and Spatio-Temporal Pixel

【时空序列预测第八篇】Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forec

Learning hierarchical spatio-temporal features for action recognition with ISA

Inductive Representation Learning In Temporal Networks via Causal Anonymous Walks

「Computer Vision」Note on Pseudo-3D Residual Net (P3D ResNet)

「Computer Vision」Note on Deep Spatio-Temporal Fully Convolutional Networks

【论文阅读】Spatio-Temporal Graph Convolutional Networks:...Traffic Forecasting[时空图卷积网络:用于交通预测的深度学习框架]（3）

读书笔记3：Representation Learning on Graphs with Jumping Knowledge Networks

[TPAMI-2023] Enhanced Spatio-Temporal Interaction Learning for Video Deraining: Faster and Better

读书笔记9：Spatio-Temporal LSTM with Trust Gates for 3D Human Action Recognition

【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

【程序阅读】Spatio-Temporal Graph Transformer Networks for Pedestrian Trajectory Prediction/trainval.py

【论文阅读】Spatio-Temporal Graph Transformer Networks for Pedestrian Trajectory Prediction/ECCV

【程序阅读】Spatio-Temporal Graph Transformer Networks for Pedestrian Trajectory Prediction/STAR/star.py

论文笔记：ST2Vec: Spatio-Temporal Trajectory SimilarityLearning in Road Networks

Residual Learning

Machine Learning - Neural Networks Representation Part II

视频超分算法VESPCN：Real-Time Video Super-Resolution with Spatio-Temporal Networks and Motion Compensation

ResNet: Deep Residual Learning for Image Recognition详解

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)