目标检测之Fast RCNN概述 - 代码天地

目标检测之Fast RCNN概述

企业开发 2023-10-05 09:53:55 阅读次数: 0

基本原理

Fast Rcnn主要步骤为

利用SR算法生成候选区域
利用VGG16网络进行特征提取
利用第一步生成的候选区域在特征图中得到对应的特征矩阵
利用ROI pooling将特征矩阵缩放到相同大小并平展得到预测结果

相对于RCNN的优化

在这里插入图片描述
主要有三个改进

不再将每一个候选区域依次放入CNN网络中进行特征提取等一系列操作，而是采取将整张图输入网络，得到特征图。然后再利用原图中的候选区域在特征图中对应的区域进行展平，得到预测结果。
不再需要对图片进行强制缩放，而是采取利用ROI Pooling缩放到相同大小。
不再使用SVM进行分类，而是使用softmax进行代替。

优化意义

第一个优化点
一张图片只需要通过卷积网络一次，减少了大量的运算，但是对于特征图的每一个候选区域，全连接层需要对每一个候选区域进行一次运算处理，而算法作者使用SVD进行加快处理。
第二个优点
roi pooling可以提高训练处理速度，更好解决缩放问题。
第三个优化点

将分类的损失纳入网络训练整个过程中，相对于RCNN减少了对磁盘空间的占用。
全连接层有两个分支，一个用于softmax分类，另一个用于位置回归。
损失函数为
$L(p,u,t^u,v)=L_{cls}(p,u)+\lambda [u\geqslant 1]L_{loc}(t^u,v)$
其中 $L_{cls}(p,u)=-log{(p,u)}$ 是分类损失，p是预测的概率，u是真实标签。
$\lambda[u \ge 1]L_{loc}(t^u,v)$ 是位置损失，v是预测得到的偏移量与缩放系数， $t^u$ 是实际的候选框与真实框的偏移量与缩放系数，与RCNN一致。
前面的系数 $\lambda[u \ge 1]$ 是用于判断候选区域为背景还是物体。如果是背景，则不计算；如果是物体，则计算回归。
其中
$L_{loc}(t^u,v)=\sum_{i\epsilon \{x,y,w,h\}}smooth_{L_1}(t_i^u-v_i)$
$smooth_{L_1}(x)=\left\{\begin{matrix}0.5x^2\ \ \ \ \ \ if\ |x|< 1\\|x|-0.5\ \ otherwise\end{matrix}\right.$

猜你喜欢

转载自blog.csdn.net/qq_44116998/article/details/128425273

目标检测之Fast RCNN概述

目标检测之Fast-RCNN

目标检测篇之---RCNN, Fast RCNN, Faster RCNN

深度学习之目标检测之Fast RCNN

对抗网络之目标检测应用：A-Fast-RCNN

图解目标检测之 Fast-RCNN 算法原理详解

RCNN系列总结：RCNN -> Fast RCNN -> Faster RCNN概述

【RCNN系列】Fast RCNN目标检测模型

RCNN系列目标检测方法概述

目标检测之RCNN、Fast RCNN 、Faster RCNN技术演进与对比

深度学习之目标检测算法 RCNN、Fast RCNN、Faster RCNN 的基本思想

目标检测学习总结之RCNN、SPP-net、Fast RCNN、Faster RCNN、YOLO、SSD的区别

目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN

RCNN, SPP-Net, Fast RCNN, Faster RCNN概述

【目标检测】Fast RCNN算法详解

目标检测：fast-rcnn学习下

目标检测】Fast RCNN算法详解

目标检测第二弹——Fast RCNN

目标检测：Fast RCNN网络详解

CV目标检测（七）——Fast-RCNN

Fast-RCNN目标检测算法

大话目标检测经典模型（RCNN、Fast RCNN、Faster RCNN）

目标检测经典模型（RCNN、Fast RCNN、Faster RCNN）

目标检测：RCNN-＞Fast RCNN-＞Faster RCNN

目标检测之faster Rcnn算法原理解读（R-CNN与fast Rcnn）01

目标检测之RCNN

# 经典目标检测识别方法概述RCNN/FAST/FASTER RCNN/MASK RCNN/SSD/DSSD/YOLO V1/YOLO V2等

RCNN (Regions with CNN) 目标物检测 Fast RCNN的基础

【目标检测】RCNN, Fast-RCNN, Faster-RCNN 目标检测算法总结

目标检测之Faster RCNN

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)