TSM视频理解解读 - 代码天地

TSM视频理解解读

其他 2020-04-06 23:57:02 阅读次数: 0

几个月前我做了TSM的测试工作，由于的确比较笨，用pretrained model测试单个视频我都费了好多天。

paper在此，pytorch代码在此。

总体：

TSM达到三维卷积的效果，但是只有2维卷积的复杂度。Temporal Shift Module就是沿着时间维度移动部分通道,因而方便帧之间的信息交换。

第二个图是双向的TSM，将过去和未来的帧与现在的帧交融。多余的截断，缺少的补零。离线模型。

第三个图同向TSM。只将过去帧和当前帧进行交融。因为这个是实时预测，不能获取未来帧的信息。

这种操作就是shift，翻译为移位/位移，但移动的多了效果并不好，shift所有的channel效果并不好（也要保持空间特征的学习能力啊），推断时也费时间。

网络结构：

backbone为ResNet50（也可以是其他预训练的模型，MobileNetV2则可放移动端），在每个残差模块（residual block）都嵌入了TSM，时间域感受野增大1倍，仅仅通过移位的操作就能实现伪3D模型的效果，也没有增加计算量。

在线模型在推断时，保存每个残差模块的1/8特征图到内存中，在下一帧替换掉该帧的前1/8，并将该1/8存入内存，因此使用的是7/8当前帧的特征图和1/8的旧的特征图。

batch_size=64，dropout=0.5，初始学习率0.01，采用kinetics数据预训练的权重进行fine-tune，固定BN层，为提高acc，复杂的视频内容sample较多的clips（8或16帧为一个clip）在somethingV1数据上只有一个clip，中心crop，224*224

代码就不看了。没时间了。

另外有相关问题可以加入QQ群讨论，不设微信群

QQ群：868373192

语音图像视频深度-学习群

发布了252 篇原创文章 · 获赞 246 · 访问量 9万+

私信关注

猜你喜欢

转载自blog.csdn.net/SPESEG/article/details/105347181

TSM视频理解解读

时空建模新文解读：用于高效视频理解的TSM

自动分类打标签！飞桨TSM模型帮你做视频理解

TSM视频测试——中间篇

TSM视频测试——中间篇

TSM模型测试——测试视频

TSM

TSM视频测试——终结篇啊

TSM视频测试——终结篇啊

TSM视频测试之人生艰难啊

TSM视频测试之k400

TSM视频测试之k400

TSM视频测试——中间篇二

TSM视频测试——中间篇二

TSM视频测试之人生艰难啊

slowfast解读：用于视频理解的双模CNN

TSM数据保留策略中的几个难理解的概念

关于WebRTC视频Android端实现的原理解读

TSM的解决

Redis深入之道：原理解析、场景使用以及视频解读

slowfast解读：facebook用于机器视觉分析视频理解的双模CNNk

https原理解读

hbase原理解读

alloc原理解读

ZooKeeper原理解读

XLNet原理解读

CountDownLatch - 原理解读

ConcurrentHashMap - 原理解读

CopyOnWriteArrayList - 原理解读

CyclicBarrier - 原理解读

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)