【论文学习笔记006】R-FCN - 代码天地

【论文学习笔记006】R-FCN

其他 2020-03-28 10:53:11 阅读次数: 0

文章目录

1.论文信息
2. 论文创新点
3.欲解决的问题
4.解决方案

4.1 概述
4.2 主干架构
4.3 位敏得分图&位敏ROI池化
4.4 训练

5.几点思考

5.1 平移不变性以及平移敏感性

6.论文结果
7.待解决的问题

1.论文信息

题目	R-FCN: Object Detection via Region-based Fully Convolutional Networks
作者	Jifeng Dai, Yi Li, Kaiming He, Jian Sun
年份	2016
论文地址	https://arxiv.org/abs/1605.06409
项目地址	https://github.com/daijifeng001/r-fcn

2. 论文创新点

改造Faster RCNN中的ROI Pooling层，设置位置敏感得分图实现平移不变性以及平移敏感性；共享计算
改用更加强大的ResNet作为骨干网络

3.欲解决的问题

提升Faster RCNN的检测速度

4.解决方案

4.1 概述

在这里插入图片描述

整体架构图如上所示
基于ResNet-101骨干网络，采用前100个卷积层提取特征
采用RPN网络生成ROI
采用位置敏感得分图以及ROI一起池化，经过softmax回归，得到每个ROI属于每个类别的概率；同时ROI与回归层的输出进行池化可得每个ROI的坐标

4.2 主干架构

基于ResNet-101，仅采用前100层卷积层提取特征，去掉了池化层与全连接层；
最后一个卷积块是2048维，附加了一个随机初始化的1024维的1x1的卷积层以降低维度；
采用kk(C+1)个通道的卷积层生成得分图

4.3 位敏得分图&位敏ROI池化

为了在ROI中明确编码位置信息，将每个ROI分成KxK个bins；在第i行第j列的bin中，采用位敏ROI池化操作，将结果汇集在第(i,j)个得分图上：
用KxK个得分图对ROI区域进行投票，产生(C+1)为向量(含有1个背景)，然后计算每个类别的softmax响应：
$r_{c}(\Theta)=\sum_{i, j} r_{c}(i, j | \Theta)$ $s_{c}(\Theta)=e^{r_{c}(\Theta)} / \sum_{c^{\prime}=0}^{C} e^{r_{c} \prime}(\Theta)$
除了KxKx(C+1)个卷积层，附加一个4xKxK个卷积层用于边界框回归。对于每一个ROI生成一个4xKxK维的向量，再通过平均投票得到一个4维向量t

4.4 训练

损失函数为每个ROI上的交叉熵损失与边界框回归损失之和：
ROI与ground truth 的IOU大于等于0.5时，为正样本，反之负样本；

5.几点思考

5.1 平移不变性以及平移敏感性

平移不变性是指无论目标怎么移动，扭曲，最终识别结果不变；平移敏感性是指目标的位置发生变化，输出的目标坐标值随之变化；
ResNet-100网络层数较深，平移不变性明显，但随着输出的特征图不断变小，目标在输入中的小偏移经过很多层池化后在特征图上很难感知，因此平移敏感性会变差；
在ResNet-100中间(conv4与conv5之间)加个ROI层，ROI层提取出的proposal中，有的对应前景label，有的对应背景label，proposal位置的偏移就有可能造成label分类的不同，分类loss对proposal的位置是敏感的，因此ROI层给深层网络带来了平移敏感性。

6.论文结果

PASCAL VOC2007中，mAP为83.6%，FPS为6

7.待解决的问题

检测帧率没有达到实时

发布了15 篇原创文章 · 获赞 14 · 访问量 1255

私信关注

猜你喜欢

转载自blog.csdn.net/chiyukunpeng/article/details/103123991

【论文学习笔记006】R-FCN

R-FCN 论文学习

论文阅读: R-FCN

R-FCN论文笔记（R-FCN: Object Detection via Region-based Fully Convolutional Networks）

目标检测学习笔记2 ---- R-FCN/Yolo

深度学习（目标检测）---R-FCN

R-FCN

R-FCN解读

R-FCN详解

R-FCN：

R-FCN理解

【深度学习R-FCN】——深刻解读R-FCN网络结构

R-FCN论文翻译——中英文对照

目标检测论文解读9——R-FCN

R-CNN系列阅读笔记(5): R-FCN

R-FCN(R-FCN: Object Detection via Region-based Fully Convolutional Networks)论文详读

系统学习深度学习（四十六）--R-FCN

深度学习系列之R-FCN个人总结

重新训练R-FCN

代码阅读：R-FCN

R-FCN算法详解

【论文学习笔记002】Fast R-CNN

【论文学习笔记001】R-CNN

Fast R-CNN 论文学习笔记

Faster R-CNN 论文学习笔记

R-FCN算法及Caffe代码详解

目标检测方法——R-FCN

目标检测系列（五）：R-FCN

目标检测之R-FCN

目标检测之 R-FCN

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)