Context R-CNN一种基于注意力机制的视频检测算法 - 代码天地

Context R-CNN一种基于注意力机制的视频检测算法

其他 2021-03-20 21:06:14 阅读次数: 0

最近遇到同一环境下，拍摄多张图片，检测结果存在差异的问题，故调研，考虑使用融合多帧信息去解决上述问题，发现这篇论文，该算法适用于我当前的问题，更适用于从事监控领域的同学，算法细节不赘述，看算法主体思路：

算法框架

算法前半部分与双阶段RPN网络基本无异，只是输入为多帧图片，得到若干anchor box的featrues，其中关键帧提取出n个，关键帧与其他帧共m个，此处双阶段检测相比于单阶段在视频信息融合上体现出了优势，即可以提取语义特征后接融合算法，接下来就是融合RPN的信息，论文中使用了attention机制，为了减少运算和存储负担，先对RPN特征进行pooling，此处操作和SEblock很像，之后通过前向得到q，k，v，q由关键帧得到，字典k则由所有帧（上下文帧以及关键帧）前向得到，接下来的操作在我看来具有很强的可解释性，通过q与k相乘，很好的查找了上下文特征与关键帧特征相关联的信息，并得到高权重，最后对v加权，投影后再叠加到关键帧的RPN特征上。

这种通过attention融合第一阶段特征进行视频分析相似的论文还有Object Detection in Video with Spatial-temporal Context Aggregation，Memory Enhanced Global-Local Aggregation for Video Object Detection，在我看来这几篇基本是一个意思，但谷歌的这篇论文写的不错，另外两篇notation满天飞，看着烦，只粗读

猜你喜欢

转载自blog.csdn.net/dl643053/article/details/107003079

Context R-CNN一种基于注意力机制的视频检测算法

(转)flask的context机制

理解GO CONTEXT机制

Android中的Context（一）

Context

基于shape context的匹配算法

Context内存泄露注意点

简单理解GO CONTEXT机制

注意力机制中的文本(上下文)向量[Context vector]【亟待解决】

Acitivy创建Context的过程(一)

android源码解读一(Context)

Meta Faster R-CNN：基于注意力特征对齐的小样本目标检测

Android全面解析之Context机制

Context的一些理解摘抄

一：从标签context:component-scan 说起

JavaWeb(一)-Servlet中的Config和Context

React Context（一）：隐式传递数据

context创建过程解析（一）之deployDescriptors

Android中Context源码分析（一）

一文搞懂Go语言Context

谈一谈对 Android Context 的理解

目标检测算法（一）：R-CNN详解

目标检测算法（一）——R-CNN

目标检测算法R-CNN

从 Context 家谱来聊一聊 Context 家族使用的设计模式？

Context 和Application Context

context.Context

IJCAI2019-Convolutional Factorization Machines for Context-Aware Recommendation翻译，何向南大佬19年论文，结合FM，注意力机制，卷积

多尺度R-CNN(2): Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural

YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进【NO.72】注意力机制Linear Context Transform Block（LCT模块）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)