目标检测之FPN - 代码天地

目标检测之FPN

编程语言 2019-04-15 13:40:54 阅读次数: 0

一、目标检测之FPN

Feature Pyramid Networks for Object Detection(用于目标检测的特征金字塔网络)

论文链接：https://arxiv.org/abs/1612.03144
论文翻译：http://noahsnail.com/2018/03/20/2018-03-20-Feature Pyramid Networks for Object Detection论文翻译——中英文对照/
论文详解：
1、https://blog.csdn.net/WZZ18191171661/article/details/79494534
2、https://xmfbit.github.io/2018/04/02/paper-fpn/
论文代码：
1、(pytorch) https://github.com/kuangliu/pytorch-fpn
2、(caffe) https://github.com/unsky/FPN

二、FPN算法

1、FPN框架
在这里插入图片描述
步骤：

首先，选择一张需要处理的图片，然后对该图片进行预处理操作；
然后，将处理过的图片送入预训练的特征网络中（如ResNet等），即构建所谓的bottom-up网络；
接着，如上图所示，构建对应的top-down网络（即对层4进行上采样操作，先用1x1的卷积对层2进行降维处理，然后将两者相加（对应元素相加），最后进行3x3的卷积操作，最后生成一个feature map，目的是减少上采样的混叠效应(aliasing effect)；
接着，在图中的4、5、6层上面分别进行RPN操作，即一个3x3的卷积后面分两路，分别连接一个1x1的卷积用来进行分类和回归操作；
接着，将上一步获得的候选ROI分别输入到4、5、6层上面分别进行ROI Pool操作（固定为7x7的特征）；
最后，在上一步的基础上面连接两个1024层的全连接网络层，然后分两个支路，连接对应的分类层和回归层；

2、FPN框架细节

图： Faster R-CNN+FPN 在这里插入图片描述

三、FPN总结

FPN能够很好的处理小目标：

FPN可以利用经过top-down模型后的那些上下文信息（高层语义信息）；
对于小目标而言，FPN增加了特征映射的分辨率（即在更大的feature map上面进行操作，这样可以获得更多关于小目标的有用信息）；

猜你喜欢

转载自blog.csdn.net/thisiszdy/article/details/89309580

目标检测之FPN

目标检测之FPN理解

目标检测算法之FPN（附FPN代码实现）

目标检测之FPN（Feature Pyramid Net）

目标检测--FPN解析

目标检测算法之——FPN（Feature Pyramid Networks）

目标检测之 FPN( Feature Pyramid Networks for Object Detection)

目标检测DET | FPN论文

理解用于目标检测的FPN

目标检测论文解读13——FPN

目标检测：Feature Pyramid Networks（FPN）

【目标检测】FPN（Fature Pyramid Network）详解

【目标检测】FPN(Feature Pyramid Network)

目标检测篇-FPN论文精读

目标检测算法：FPN思想解读

物体检测之FPN

论文阅读|目标检测之隐式的求解特征金字塔i-FPN

FPN(Feature Pyramid Network)多尺度目标检测方案

目标检测：FPN_tensorflow训练自己的数据集

FPN：目标检测的特征金字塔网络

【深度学习】目标检测网络结构MASK RCNN FPN

【CV】FPN：用于目标检测的特征金字塔网络

AC-FPN：目标检测中的注意力机制

CV之OD：计算机视觉领域目标检测任务代表性算法原理简介(R-CNN、Fast R-CNN、Faster R-CNN、R-FCN、FPN、SSD、YOLO~YOLOv3）、FPN、RetinaNet

目标检测学习--FPN(特征金字塔网络)-解决多尺度检测问题

[深度学习]Object detection物体检测之FPN(11)

目标检测之小目标检测

目标检测之fasterRCNN

目标检测之SSD

目标检测之RetinaNet

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)