《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》 - 代码天地

《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

其他 2018-11-24 12:45:43 阅读次数: 0

动机

这篇文章开篇就指出，我们的模型是要从人体动作的序列中选取出最informative的那些帧，而丢弃掉用处不大的部分。但是由于对于不同的视频序列，挑出最有代表性的帧的方法是不同的，因此，本文提出用深度增强学习来将帧的选择模拟为一个不断进步的progressive process。
强化学习是通过优化选择actions的policy来最大化agent从environment所获得的rewards。文章中说至今为止，在动作识别领域，增强学习的应用还不多。
做skeleton based action recognition会用到人体关节的邻接矩阵，之前做skeleton based action recognition基本都是有骨骼相连的关节对才会在邻接矩阵的相应位置标记一个1，没有连接的位置就标记为0
但本文不同，本文考虑到不相连的关节之间的相互关系也是很重要的，比如两只手不是直接相连的，但是两只手的相互位置关系在识别‘拍手’这个动作时就尤为重要。

方法

本文的人体关节邻接矩阵是这么设计的：如果两个关节有连接，就在邻接矩阵相应位置标记为α，称之为intrinsic dependencies，否则标记为β，称之为extrinsic dependencies。此外关节没有self connection，是邻接矩阵对角元素全是0.
思路简单概括为：
1. 我们的输入是一段视频，视频中有多个帧。
2. 我们想用RL的算法来选择关键帧（本文是FDNet）
3. 再把选取到的关键帧输入到GCNN网络，得到这个vedio的标签

定义问题的决策链

已知输入的是含有多个帧的一段视频，但我们不要全部用到全部帧数
所以我们想提取关键帧，设定提取的关键帧数为m,把这m个关键帧按序号排序，每一个action表示这些关键帧是要向左移动，向右移动或是保持当前位置。
设定迭代步数，当程序迭代步数达到设定值时，就停止程序；

State and Action

State

针对选关键帧这个MDP问题，状态S可以表示为： {Sa,Sb}
即它由来两部分组成，其中Sa=[F,M] 也是由两部分组成的。F表示整个视频的信息，它张量的形状为：f×N×3。其中f表示视频的所有帧数，N表示每一帧中的骨架模型的节点数，3表示每一个骨架节点的3D坐标。如下图所示是一个拍手动作的其中三帧，每一帧都是用一些骨架信息表示，其中包含了骨架中有多少个关节节点以及它们的3D坐标。

对于M就表示所有被提取的关键帧信息，用一个形如m×N×3的张量表示，其中m表示关键帧的数目
最后Sb one-hot, 它对应到整个视频的每一帧，如果对应的元素值为1,那么说明该帧被提取为关键帧，其余则为0 ;

Action

action的动作由FDNet输出
action的定义比较简单：

帧向左移动
帧向右移动
帧保持不动

现在，我们打开看一下FDNet网络的结构

Reward function

1542282682251

GCNN

1542282748198

算法

猜你喜欢

转载自blog.csdn.net/u010067397/article/details/84136540

《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

读书笔记5：Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition

论文翻译：Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition

论文翻译：Ensemble Deep Learning for Skeleton-based Action Recognition using Temporal Sliding LSTM networ

Skeleton-Based Action Recognition with Directed Graph Neural Network

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Deep Learning of Action Recognition

Two-Stream Adaptive Graph Convolutional Network for Skeleton-Based Action Recognition

翻译：Two-Stream Adaptive Graph Convolutional Networks for Skeleton-Based Action Recognition

论文翻译：Skeleton-Based Action Recognition with Directed Graph Neural Networks

论文翻译：Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition

论文翻译：Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

论文翻译：Skeleton-Based Action Recognition with Multi-Stream Adaptive Graph Convolutional Networks

论文翻译：Make Skeleton-based Action Recognition Model Smaller, Faster and Better

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition学习

Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition 论文阅读

论文翻译：Two-Stream 3D Convolutional Neural Network for Human Skeleton-Based Action Recognition

论文翻译：Spatio-Temporal Naive-Bayes Nearest-Neighbor (ST-NBNN) for Skeleton-Based Action Recognition

基于深度学习的行为识别（Deep Learning-based Action Recognition）

论文翻译：Learning Action Recognition Model From Depth and Skeleton Videos

浅谈对Two-Stream 3D Convolutional Neural Network for Human Skeleton-Based Action Recognition，基于人体骨架的动作识

浅谈对Skeleton-Based Action Recognition with Directed Graph Neural Networks，基于骨架的有向图神经网络动作识别理解

Spatial Temporal Graph Convolutional Network for Skeleton-Based Action Recogonition

Relational Deep Reinforcement Learning

022 Deep Reinforcement Learning

[转]Deep Reinforcement Learning Based Trading Application at JP Morgan Chase

Policy-based Reinforcement learning

Deep Reinforcement Learning is a waste of time

Random Thoughts on Deep Reinforcement Learning

# Asynchronous Methods for Deep Reinforcement Learning

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)