视频分类数据集介绍

视频分类数据集

 

在视频分类项目中,有很多经典的公开数据集,目前主要的数据集如列表所示:

 

重点介绍三个中等规模的数据集。

1. UCF101

动作识别数据集,从youtube收集而得,共包含101类动作。其中每类动作由25个人做动作,每人做4-7组,共13320个视频,分辨率为320*240,共6.5G。

UCF101在动作的采集上具有非常大的多样性,包括相机运行、外观变化、姿态变化、物体比例变化、背景变化、光纤变化等。

101类动作可以分为5类:人与物体互动、人体动作、人与人互动、乐器演奏、体育运动。

参考文档:http://crcv.ucf.edu/papers/UCF101_CRCV-TR-12-01.pdf

每类动作视频数量:

下载网址:http://crcv.ucf.edu/data/UCF101/UCF101.rar

 

 

2. HMDB

HMDB51包含51类动作,共有6849个视频,每个动作至少包含51个视频,分辨率320*240,。来自于YouTube,google视频等,共2G.

动作主要包括:

1) 一般面部动作微笑,大笑,咀嚼,交谈。

2) 面部操作与对象操作:吸烟,吃,喝。

3) 一般的身体动作:侧手翻,拍手,爬,爬楼梯,跳,落在地板上,反手翻转、倒立、跳、拉、推、跑,坐下来,坐起来,翻跟头,站起来,转身,走,波。

4) 与对象交互动作:梳头,抓,抽出宝剑,运球、高尔夫、打东西,球、挑、倒、推东西,骑自行车,骑马,射球,射弓、枪、摆棒球棍、剑锻炼,扔。

5) 人体动作:击剑,拥抱,踢某人,亲吻,拳打,握手,剑战。

 

 

下载:http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#Downloads

 

3.Kinetics

Kinetics-600是一个大规模,高质量的YouTube视频网址数据集,其中包含各种人的动作。 还有一个2017年发布的初始数据集,现在称为Kinetics-400。
该数据集由大约500,000个视频组成,涵盖600个人类动作,每个动作至少有600个视频。 每个视频持续大约10秒钟,并标有一个类。 这些动作涵盖了广泛的范围,包括人 - 物体交互,如演奏乐器,以及人与人之间的互动,如握手和拥抱。

下载:https://deepmind.com/research/open-source/open-source-datasets/kinetics/

或者https://github.com/activitynet/ActivityNet/blob/master/Crawler/Kinetics/README.md

猜你喜欢

转载自blog.csdn.net/dake1994/article/details/82591852