Facebook开源PySlowFast视频理解代码库 - 代码天地

Facebook开源PySlowFast视频理解代码库

业界资讯 2023-08-11 20:37:41 阅读次数: 0

近年来，Facebook 人工智能研究（FAIR）一直在为视频理解研究做出重大贡献。在2019年10月的ICCV上，该团队推出了一个基于Python的代码库PySlowFast。FAIR现在是开源的PySlowFast，还有一个预先训练的模型库，并承诺继续为项目添加尖端资源。

在这里插入图片描述

“PySlowFast”这个名字来源于一种新颖的二元性——该模型既有一条以低帧速率运行以捕获空间语义的慢速路径，也有一条以高帧速率运行的轻量级快速路径，以精细的时间分辨率捕获运动，并且可以学习有用的时间信息用于视频识别。

2023-07-28T03:28:48.png

PySlowFast的引入解决了ML研究人员的一些需求。首先，开源社区中没有简洁、高效、易于修改的视频理解代码库。其次，重建当今最先进的深度学习模型可能令人头疼，因为此类模型通常需要数十个GFlops，几天的训练和反复的实验调整才能使每个细节都正确。对于许多研究人员来说，这可能是非常耗时和资源的。

在这里插入图片描述

PySlowFast将使研究人员能够轻松重现视频分类和动作检测算法，无论它们是基本的还是尖端的。FAIR还开源了一些预训练模型，为研究人员省去了重复培训课程的麻烦。

在这里插入图片描述

PySlowFast在视频分类数据库Kinetics 400上的性能

PySlowFast还包括一个专用接口，通过简单的编辑支持多模态视频理解、视频自监督学习等任务。FAIR表示，PySlowFast将积极实时更新尖端算法，以确保它仍然是视频理解领域最新和可靠的基准。

安装完成后，用户可以下载model_ZOO提供的预训练模型和相应的配置文件，并运行以下代码，在不同的视频数据库上测试性能：

python tools/run_net.py \
--cfg configs/Kinetics/C2D_8x8_R50.yaml \
DATA.PATH_TO_DATA_DIR path_to_your_dataset \
NUM_GPUS 2 \

PySlowFast代码库位于GitHub上。相关论文有arXiv：用于视频识别的慢速快速网络和非局部神经网络。

猜你喜欢

转载自blog.csdn.net/virone/article/details/131977140

Facebook开源PySlowFast视频理解代码库

Facebook开源算法代码库，轻松复现前沿视频理解模型

全方位支持图文和音视频、100+增强功能，Facebook开源数据增强库AugLy

Facebook Research 开源代码Detectron 调试笔记

Facebook 开源代码分析工具 —— Mariana Trench

[转]Facebook的c++开源库folly介绍

Facebook发布开源“Detectron”深度学习库，用于对象检测

Faiss(Facebook开源的高效相似搜索库)学习小记

开源音视频库

Facebook 开源 ELF OpenGo

Facebook 前端开源项目

[开源推荐]Facebook开源的JavaScript库：React 【轻量级app开发】

强化学习工具Horizon开源：Facebook曾用它优化在线视频和聊天软件

开源库和开源代码源码

slowfast解读：facebook用于机器视觉分析视频理解的双模CNNk

slowfast是facebook计算机视觉用于视频理解的双模CNN

轻松打败世界级棋手！Facebook 开源 AI 围棋源代码

170个新项目，579个活跃代码仓库，Facebook开源年度回顾

Facebook 开源图像处理库 Spectrum，优化移动端图像生成

一句提示词生成整个代码库——Gpt Engineer神级项目开源（附演示视频）

Facebook 如何发布代码

facebook是如何管理代码的

开源代码库 Github教程

minizip -基于zlib开源代码库

60% 的企业代码库包含开源漏洞

Github开源库Xpopup代码阅读

MMIT冠军方案 | 用于行为识别的时间交错网络，商汤公开视频理解代码库

Facebook 开源 3D 深度学习函数库 PyTorch3D，也可用于二维场景

语义分割+视频分割开源代码集合

短视频seo源码矩阵系统开源---代码php分享

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)