深度学习完全攻略！（连载十：faster-RCNN模型理解） - 代码天地

深度学习完全攻略！（连载十：faster-RCNN模型理解）

其他 2020-02-10 22:45:01 阅读次数: 0

这一节，我们写一写faster-RCNN.

在上一节中，我们看到，fast-rcnn还是需要有个region proposal的生成过程，这个很不OK。尤其是对处女座来说，很不友好。那么faster-rcnn就是为了解决这个问题而存在的。既然CNN那么牛，既然可以用大把的参数来解决问题，为什么还要做乱七八糟的额外处理呢。归根结底还是对神经网络的不了解。不多说，上内容。

第一部分 faster-rcnn原理

先上图，就用原文中的图吧。

相比于fast-rcnn, faster-rcnn最大的特点是去掉了额外的候选区域的生成算法。从输入到输出全部集成到神经网络中，这个就是传说中的RPN。哎呀，看着都舒服，强迫症治愈。

现在我画一张自己的理解图。

第二部分 faster-rcnn关键步骤说明

在第一部分的图2中，我们已经介绍了整个的faster-rcnn.现在对图中几个关键的地方做说明。

扫描二维码关注公众号，回复： 9069174 查看本文章

（1）为什么是n*5?n是总的ground truth box， 5表示box的位置、尺寸和类别组成的向量的个数。（x,y,w,h,cls）

（2）为什么是38*57*512？表示经过CNN网络之后单幅图像生成的特征图。

（3）为什么是19494*4？在生成anchor box的时候，对38*57图中的每个像素点，均生成9个anchor box，这9个anchor box的构成如下图所示。4表示anchor box的坐标和尺度构成的向量，（x,y,w,h）

（4）2000/300*5是指在train阶段，经过极大值抑制后（去除2000个boxes中那些重合度较高的box），会保留大概2000个boxes，而在测试的时候，大概有300个boxes.每个box包含位置、尺寸和类别信息。

（5）256*5？第四步的boxes经过sample，得到大概256个.（只取一部分。）

（6）256*7*7*512？7*7*512是指经过一系列的变换后，将每个候选区的特征图转为7*7*512大小，而总共有256个box用于预测。

（7）256C，256*4C？256C表示所属的类别，而256*4C表示每个类别的bounding box。

（8）38*57*（9*2），（9*4）？表示经过RPN网络之后，（9*20）表示前景还是背景，（9*4）表示box的坐标和尺寸。再迭代的时候，背景是不参与迭代的，因为没有目标存在。

在图2中还有一个大大的红色的框框，这个框框表示在实际使用的时候的流程。

我想，图2可以很明白的看出faster-rcnn是怎么工作的。只需要结合具体的代码，再理解一下就行。

下一节我们写一写SSD

本文已同步至公众号，方便交流。欢迎订阅。

Aoulun

发布了77 篇原创文章 · 获赞 150 · 访问量 23万+

私信关注

猜你喜欢

转载自blog.csdn.net/Aoulun/article/details/95019011

深度学习完全攻略！（连载十：faster-RCNN模型理解）

深度学习完全攻略！（连载八：RCNN模型理解）

深度学习完全攻略！（连载九：fast-RCNN模型理解）

深度学习完全攻略！（连载二十：你家有老鼠吗？手把手教你怎么用faster-rcnn找出老鼠）

深度学习完全攻略！（连载十一：YOLO原理理解）

深度学习完全攻略！（连载七：先从基本的模型开始-端到端的验证码识别）

深度学习完全攻略！（连载四：GPU加速技术指南）

深度学习完全攻略！（连载六：CUDA10.1+tensorflow+VS+anaconda3安装）

深度学习完全攻略！（连载五：GPU加速技术指南）

深度学习完全攻略！（连载三：GPU加速技术指南）

深度学习完全攻略！（连载二：GPU加速技术指南）

深度学习完全攻略！（连载一：GPU加速技术指南）

深度学习完全攻略！（连载十九：卷积神经网络中常用奇淫巧计总结）

Faster-RCNN理解

faster-rcnn学习

转载Faster-rcnn理解

从RCNN到faster-RCNN的理解

深度学习目标检测算法——Faster-Rcnn

Faster-RCNN基础学习

基于深度学习的目标检测技术 RCNN，fast-RCNN和faster-RCNN

pubmed检索完全攻略

外挂编写完全攻略

GitHub个人Blog完全攻略

（31）sed命令完全攻略

JavaScript语句完全攻略（总结）

B树完全攻略

faster-rcnn中，对RPN的理解

Faster-RCNN论文原理理解

faster-rcnn 原理解析

使用faster-rcnn训练自己的模型

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)