五分钟读完一篇文章之R-CNN - 代码天地

五分钟读完一篇文章之R-CNN

企业开发 2023-06-05 05:30:22 阅读次数: 0

Alex-Net网络在基本结构方面与十几年前的LeNet几乎毫无差异，但由于数据和硬件设备（尤其是GPU）翻天覆地的发展，才使得深度神经网络不再是“晚会的戏法”，真正变成了切实落地可行的工具和应用手段。由于Alex-Net的出现，世人的目光重回神经网络。

图 Alex-Net网络结构

Alex-Net网络含有5个卷积层，2个全连接层。R-CNN（Regions with CNN features）作者受到Alex-Net的启发，尝试将Alex-Net在ImageNet数据集上的目标识别的能力泛化到PASCAL VOC数据集上来做目标检测（现在称为迁移学习）。

R-CNN要解决的两个问题
1.如何利用卷积网络进行目标定位；
2.如何在小数据集上训练出性能良好的网络模型。

图 R-CNN 目标检测流程

R-CNN训练流程
1.Alex-net网络使用ImageNet数据集进行pre-train（“图像分类”）；
2.使用SS提取的候选区域进行fine-tune（“目标检测”）。

R-CNN目标检测流程
1.读取一张输入图像；
2.使用SS(Selective Search)提取约2000个自下而上（从细节到整体）的候选区域（Region Proposals）；
3.将候选区域（需要缩放至227x227，使其兼容Alex-Net）分别输入Alex-net网络，将Alex-net的fc7层输出作为特征；
4.将fc7层的输出输入SVM中进行分类，针对不同种类集合使用NMS（非极大性抑制）进行处理。

最后为了提升目标定位的准确性，R-CNN作者又训练了一个线性的回归模型，这个模型能够针对候选区域的pool5数据进行预测，得到一个更加准确的Box位置（详细介绍请参考我的另一篇文章）。

更加详细的内容请参考作者论文：Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5)

总结
现在来看R-CNN虽然有着各种各样的缺点，但却是第一个成功地将深度学习应用到目标检测的算法。

猜你喜欢

转载自blog.csdn.net/weixin_41006390/article/details/105261770

五分钟读完一篇文章之R-CNN

五分钟读完一篇文章之仿射变换

五分钟读完一篇文章之张量

五分钟读完一篇文章之mAP

五分钟读完一篇文章之相机标定

五分钟读完一篇文章之激活函数

五分钟学Java：一篇文章搞懂spring和springMVC

科研人的利器：利用New Bing五分钟读完一篇论文

五分钟学编程：一篇文章复习一下Spring和SpringMVC

五分钟学Java：一篇文章带你搞懂spring全家桶套餐

五分钟学后端技术：一篇文章教你读懂大数据技术栈！

五分钟学后端技术：一篇文章告诉你如何学习云计算！

一篇文章30分钟带您了解分布式锁

R-CNN 一篇就够了

10分钟一篇文章教会你Event loop——浏览器和Node

1分钟让你搞懂python中的编码！专门给小白写的一篇文章

花10分钟看了一篇前端文章就入门了，现在复制粘贴这篇文章给你们看

安卓app在线开发！花三分钟看完这篇文章你就懂了！看这一篇就够了！

目标检测（七）一篇文章5分钟搞懂卷积神经网络——基于tensorflow2.0训练Alexnet网络实践

【GPU精粹与Shader编程】(七) 一篇文章带你读完《GPU Gems 3》

【一篇文章带你读完《黑客攻防300招》】

【一篇文章带你读完《C++游戏编程入门第4版》】

【一篇文章带你读完《C语言实战开发》】

一篇文章

五分钟搞定 Linux 文档全部知识，就看这篇文章

【一篇文章带你读完《C++游戏与图形编程基础第2版》】

一篇30分钟文章带您掌握布隆过滤器(Redisson)

花30分钟，我用ChatGPT写了一篇2000字文章（内附实操过程）

目标检测(一)之 R-CNN

一篇文章入门之网络

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)