T1904W17:Action recognition based on 2D skeletons extracted from RGB videos - 代码天地

T1904W17:Action recognition based on 2D skeletons extracted from RGB videos

其他 2019-04-09 13:34:41 阅读次数: 0

论文标题：Action recognition based on 2D skeletons extracted from RGB videos

来源：谷歌最新论文推荐，来自全球排名大概550名的蒙斯大学

解决问题/主要思想：

使用openPose对图像提取关键点，然后计算关键点的信息，分成三个矩阵，输入网络训练，从而对动作进行分类

成果/优点：

the highest accuracy which is 83.317% with ResNet152 in cross- subject.

缺点：

具体内容：

openPose还没有研究的很深入，下次阅读一下

七个目前基于pose方面的动作识别的前沿进展：

3.1.使用openPose抓取人物关键点

3.2.数据的转换

提取出关键点位置信息和置信度信息之后，对这些数据进行结构上的调整，XYC分别属于一个矩阵，每一行是时间变化，每一列是每一个关键点对应的x

这样安排，估计是把每一个结点的位置信息和时间信息放在一起，这样的话，对网络可以用到位置和时间特征。

3.3各类测试

1.把c换成（x+y）/2

2.去掉信息量小的眼睛耳朵信息

3.改变训练时的结点组合情况

最终测试结果：

5.1模型比较

5.2 深层网络还是浅层

深层表示训练全部的层

浅层表示：冻结底层的参数，只训练最后的分类层

结果显示，深层比较好

5.3物体交叉，视觉交叉

cross subject，即测试集中的人和训练集中的人没有交集

另一种是cross view，即测试数据的拍摄角度和训练数据不同。

猜你喜欢

转载自www.cnblogs.com/captain-dl/p/10676190.html

T1904W17:Action recognition based on 2D skeletons extracted from RGB videos

论文翻译：Learning Action Recognition Model From Depth and Skeleton Videos

Improved RGB-D-T based Face Recognition 论文笔记

基于图像的RGBD视频的等级分割注解（eficiency hierarchi graph-based segmentation of RGB-D videos）

RGB-D object recognition and pose estimation based on pre-trained convolutional neural network 阅读记录

“NTU RGB+D“ Action Recognition Datasets下载方法（成功）

【论文阅读】Non-volume preserving-based fusion to group-level emotion recognition on crowd videos

24.Two-Stream Convolutional Networks for Action Recognition in Videos

Two-Stream Convolutional Networks for Action Recognition in Videos[summary part]

MiCT: Mixed 3D/2D convolutional tube for human action recognition

论文翻译：2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning

《Two-Stream Convolutional Networks for Action Recognition in Videos》论文笔记

RPAN：An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos

视频动作识别--Two-Stream Convolutional Networks for Action Recognition in Videos

Two stream convolutional networks for action recognition in videos论文思想解析

动作识别论文20191104_Probabilistic selection of frames for early action recognition in videos

【视频行为识别5】(双流网络)Two-stream Convolution Networks for Action Recognition in Videos(2014)

论文笔记之Two-Stream Convolutional Networks for Action Recognition in Videos

Two-Stream Convolutional Networks for Action Recognition in Videos双流网络论文精读

【论文&模型讲解】Two-Stream Convolutional Networks for Action Recognition in Videos

Halcon-position recognition 2D

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Skeleton-Based Action Recognition with Directed Graph Neural Network

paper reading：Part-based Graph Convolutional Network for Action Recognition

论文翻译：Two-Stream 3D Convolutional Neural Network for Human Skeleton-Based Action Recognition

读书笔记21：MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition（CVPR2018）

解析Im2Flow:Motion Hallucination from Static Images for Action Recognition

SparseBEV：High-Performance Sparse 3D Object Detection from Multi-Camera Videos

视频物体检测(VID) T-CNN: Tubelets with Convolutional Neural Networks for Object Detection from Videos

浅谈对Two-Stream 3D Convolutional Neural Network for Human Skeleton-Based Action Recognition，基于人体骨架的动作识

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)