I3D论文解读(Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset) - 代码天地

I3D论文解读(Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset)

编程语言 2019-01-10 00:52:01 阅读次数: 0

版权声明：添加我的微信wlagooble，开启一段不一样的旅程 https://blog.csdn.net/nineship/article/details/86155127

论文：Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

期刊：CVPR2017

papar:https://arxiv.org/pdf/1705.07750v1.pdf

相关工作：

相关工作就是下面这个图

文章两个重大贡献：1 提出了kinetics数据集。2 提出了双流3D卷积模型

3D ConvNet

模型细节：是原论文中C3D的变种。8层卷积、5层pooling、2层全连接。与C3D的区别在于这里的卷积和全连接层后面加BN；且在第一个pooling层使用stride=2，这样使得batch_size可以更大。输入是16帧，每帧112*112。

Two-Stream Networks

LSTM缺点：能model高层变化却不能捕捉低层运动(因为在低层，每个帧都是独立地被CNN提取特征)，有些低层运动可能是重要的；训练很昂贵
Two-Stream Networks: 将单独的一张RGB图片和一叠计算得到的光流帧分别送入在ImageNet上预训练的ConvNet中，再把两个通道的score取平均

New*: Two-Stream Inflated 3D ConvNets

Implementation Details

模型：

实验结果，可以看到I3D的准确率提高了许多：

参考文章：

https://blog.csdn.net/paranoid_cnn/article/details/77933316

https://blog.csdn.net/Gavinmiaoc/article/details/81208997

https://blog.csdn.net/zzmshuai/article/details/84936338

猜你喜欢

转载自blog.csdn.net/nineship/article/details/86155127

I3D论文解读(Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset)

【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

《Qua Vadis, Action Recognition? A New Model and the Kinetics Dataset》论文解读之Two-Stream I3D

【CVPR2017，action recognition,动作识别】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

A New Representation of Skeleton Sequences for 3D Action Recognition

论文翻译：Learning Action Recognition Model From Depth and Skeleton Videos

Action CLIIP：A New Paradigm for Video Action Recognition

论文翻译：A New Representation of Skeleton Sequences for 3D Action Recognition

论文列表 for Action recognition

Kinetics dataset骨架点分布

论文翻译：Make Skeleton-based Action Recognition Model Smaller, Faster and Better

【数据集】Kinetics-600 dataset介绍

《Action recognition by dense trajectories》论文笔记

【论文笔记，action recognition,动作识别】

Compressed Video Action Recognition论文笔记

【论文阅读】Action Recognition Using Visual Attention

Action Recognition TSN论文理解

[论文理解] Attentional Pooling for Action Recognition

动作识别新论文20191110：action recognition

Action Recognition 合集

Action Recognition(行为识别)

Deep Learning of Action Recognition

Action Recognition调研

Timeception Complex Action Recognition

论文翻译：2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning

【CV论文阅读】Two stream convolutional Networks for action recognition in Vedios

论文笔记 | A Closer Look at Spatiotemporal Convolutions for Action Recognition

【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

Contextual Action Recognition with R*CNN-论文阅读

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)