目标检测: Fast R-CNN原理 - 代码天地

目标检测: Fast R-CNN原理

其他 2019-09-01 22:38:42 阅读次数: 0

Fast R-CNN论文地址: https://arxiv.org/pdf/1504.08083.pdf

1 概述:

考虑到R-CNN速度很慢, 作者提出了一个改善模型:Fast R-CNN. 相比R-CNN, Fast R-CNN的优点在于加快了selective search的步骤和同时训练分类和回归过程, 从整体上加快了速度.

Fast R-CNN对R-CNN的改进部分:

将R-CNN中三个模块(CNN, SVM, Regression)整合, 极大了减少了计算量和加快了速度
不对原始图像进行selective search提取, 而是先经过一次CNN, 在feature map上使用selective search截取候选区域, 进行分类回归
为了兼容不同图片尺度, 作者使用了ROI Pooling 算法, 将特征图池化到固定维度的特征向量.

2 ROI Pooling原理

ROI Pooling论文地址: https://arxiv.org/pdf/1406.4729.pdf

ROI Pooling也叫Spatial Pyramid Pooling(空间金字塔池化).

由于图片尺寸各不相同, 需要经过缩放拉伸到统一尺寸, 再送入CNN, 这会间接导致识别精度下降, 通过ROI Pooling可以将不同尺度的特征图输出为固定维度的特征向量, 同时也获取到了图像的特征信息, 而且速度很快.

__________________________________________________________________

3 步骤

3.1 预训练一个分类CNN
3.2 修改CNN, 将最后一个flatten层以及后面的层删掉, 换成ROI Pooling层
3.3 将图像经过CNN, 得到特征图, 使用selectiv search选出2k个候选区域
3.4 在ROI Pooling层后跟几个FC, 最后输出2个分支:

第一个分支是softmax层, 输出k+1个分类
第二个分支是regression, 预测输出k个类别的box参数

4 损失理解

为什么要使用smooth L1?

因为2点:

0点可导
loss越来越小时, 梯度也适当减小, 有助于收敛

5 与R-CNN性能比较

猜你喜欢

转载自www.cnblogs.com/dxscode/p/11443752.html

目标检测: Fast R-CNN原理

目标检测（4）-Fast R-CNN

目标检测--Fast R-CNN

目标检测：Fast R-CNN

目标检测——Fast R-CNN（二）

目标检测之Fast R-CNN

目标检测学习--Fast R-CNN

R-CNN，Fast R-CNN，Faster R-CNN原理及执行与训练的实例+实现自己的目标检测

目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

目标检测经典模型（R-CNN、Fast R-CNN、Faster R-CNN）

基于DL的目标检测技术：R-CNN、Fast R-CNN、Faster R-CNN

深度学习——目标检测（R-CNN、Fast R-CNN、Faster R-CNN）

目标检测（二）—— R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN

【目标检测】基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

目标检测系列（三）：Fast R-CNN

目标检测论文解读3——Fast R-CNN

目标检测(二)之Fast R-CNN

深度学习_目标检测_Fast R-CNN详解

目标检测系列（四）——Fast R-CNN译文

目标检测算法Fast R-CNN

目标检测(Object Detection)2--Fast R-CNN

目标检测算法（二）——Fast R-CNN

目标检测--R-CNN网络、Fast-RCNN网络

06- 算法解读 Fast R-CNN (目标检测)

目标检测之faster Rcnn算法原理解读（R-CNN与fast Rcnn）01

深度学习-目标检测R-CNN、SPP NET、Fast R-CNN、Faster RCNN浅谈

目标检测技术演进：Fast R-CNN、Faster R-CNN

1：基于深度学习的目标检测技术：RCNN、Fast R-CNN、Faster R-CNN

R-CNN系列目标检测博文汇总 Fast R-CNN（理解）

R-CNN,Fast R-CNN，YOLO等10个目标检测论文笔记

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)