Light Head R-CNN个人总结 - 代码天地

Light Head R-CNN个人总结

其他 2018-10-11 14:09:56 阅读次数: 0

1. Motivation

这里写图片描述

先梳理一下Faster RCNN和R-FCN。
Faster RCNN得到RoI后，进行RoI pooling，得到7x7xchannel的feature map，然后连接上2个FC层，再分类和回归。
R-FCN则是一方面得到RoI，另一方面继续卷积得到一个7x7x(num_cls+1)x7x7的Position sensitive score map。然后进行PSRoI pooling，得到7x7x(num_cls+1)的feature map。直接通过vote(global ave pooling)，分类和回归。

(1)针对准确率: faster rcnn通常为了减少计算量，会对7x7xchannel的feature map直接global pooling。但这样会影响定位效果。
R-FCN的PSROI pooling本身并不是RoI-wise(roi中每个grid都不是对应感受野的信息，而是不同通道的信息)，准确率通常不如faster rcnn。
(2)针对速度，faster rcnn串行计算每个roi，导致网络较慢，尤其是roi很多的情况下。
r-fcn则是因为要计算一个巨大的score map，也很费时。

所以提出light head rcnn，从而make a goog trade-off between the performance and computational speed。

2. light head rcnn

(1) thin feature map

thin指的是通道数变少了，主要针对r-fcn的score map的，原来是7x7x(num_cls+1)x7x7的feature map，现在变为7x7x10x7x7的feature map。其中两个7x7指的是w和h。通道为490。

此外，如何得到这个feature map，也不再是r-fcn中的1x1卷积，而是引入了inception结构。这里称之为large seperable convolution。
这里写图片描述
这里K=15，为了获得更大的感受野。

(2) R-CNN subnet

由于score map的通道变成了7x7x10。因此PSRoI pooling后，roi的通道只有10，无法进行vote。因此，我们连接上FC层，再进行分类和回归。

此外，除了PSROI pooing，我们也可以用RoI pooling。 RoI pooling因为时roi-wise，效果反而比PSRoI pooling好。

在rcnn subnet这块，与faster rcnn相比，没有太大的变化。

本文使用的base network 是Xception。最后作者对比了一系列实验，证明light head rcnn无论是mAP还是速度，都超过了FPN、mask r-cnn、RetinaNet、YOLOv2、SSD。

所以，尝试light head rcnn吧！

猜你喜欢

转载自blog.csdn.net/LeeWanzhi/article/details/82666664

Light Head R-CNN个人总结

Light-Head R-CNN

目标检测之Light-Head R-CNN

Light Head R-CNN论文笔记

论文阅读: Light-head R-CNN

Light-Head R-CNN 阅读笔记

Light-Head R-CNN——论文翻译

【Light-Head RCNN】《Light-Head R-CNN: In Defense of Two-Stage Object Detector》

Light-Head R-CNN: In Defense of Two-Stage Object Detector

【计算机视觉】《Light-Head R-CNN: In Defense of Two-Stage Object Detector》

Light-Head R-CNN：两步检测器保卫战

目标检测算法之Light-Head R-CNN

【论文笔记】物体检测系列 Light-Head R-CNN: In Defense of Two-Stage Object Detector

深度学习【55】物体检测：Light-Head R-CNN: In Defense of Two-Stage Object Detector

【论文笔记】【Faster Rcnn 优化】《Light-Head R-CNN: In Defense of Two-Stage Object Detector》

Light-Head R-CNN : 旷世提出用于加速two-stage detector的通用结构，速度达102fps

R-FCN:Object Detection via Region-based Fully convolutional Networks && light-head RCNN

Light-Head RCNN: In Defense of two-stage object detector

Light of future-冲刺总结

深度学习系列之Faster R-CNN 个人总结

深度学习系列之 Fast R-CNN 个人总结

深度学习系列之R-CNN 个人总结

R-CNN算法（论文部分翻译+个人总结）

Light Blog – 基于ssm的个人博客

head命令用法总结

Light Life 小组项目总结

Cascade R-CNN总结

Mask R-CNN总结

Faster R-CNN总结

head

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)