论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition - 代码天地

论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

企业开发 2019-08-18 11:47:52 阅读次数: 0

背景

　　用ConvNet方法解决图像分类、检测问题成为热潮，但这些方法都需要先把图片resize到固定的w*h，再丢进网络里，图片经过resize可能会丢失一些信息。论文作者发明了SPP pooling(空间金字塔池化)层，让网络可以接受任意size的输入。

方法

　　首先思考一个问题，为什么ConvNet需要一个固定size的图片作为输入，我们知道，Conv层只需要channel固定(彩色图片3，灰度图1），但可以接受任意w*h的输入，当然输出的w*h也会跟着变化；然而，后面的FC层却需要固定长度的vector作为输入，图片size变化->conv层输出的size变化->FC层输入的vector长度变化，这就产生了错误。

　　怎么解决这个问题呢？作者给出的方法是在最后一层Conv层后面加上一个SPP pooling层，SPP pooling层可以将接收到的不同size的输入转换成为固定的输出，保证FC层的输入长度固定。

　　

　　如图，SPP pooling层的原理很简单，例子如下：给定一个w*h的特征图，把其分别分成4*4、2*2、1*1的bin，在每个bin上面作pooling操作(文中使用的是max pooling)，最后能得到16*256-d(256-d是最后一个conv层的输出通道数)，4*256-d、1*256-d的feature vector，最后连接在一起，得到的就是21*256-d的feature vector。

　　可以看到，不管一开始的w和h取值多少，最后都能得到固定长度的feature vector作为FC层的输入，这样，ConvNet就能接受不同size的图片作为输入了。

总结

　　论文作者通过在FC层前面加上一个SPP pooling层，有效解决了ConvNet必须接受固定size的图片。

猜你喜欢

转载自www.cnblogs.com/xin1998/p/11371879.html

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition论文细读

论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》阅读笔记

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》笔记

SPP: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

SPP NET (Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

【论文快读】Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》论文阅读之SPPNet

图像检测2-SPPNet-Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition (SPP-net)

RCNN学习笔记(3):Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(SPP-net)

【目标检测】SPP-Net (Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

(39)[ECCV14] SPPNet: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

【转】R-CNN学习笔记3:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(SPP-net)

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition、SPP-Net、空间金字塔池化

论文阅读笔记（四）SSPnet__Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognotion

论文解读| Very Deep Convolutional Networks for Large-Scale Image Recognition

Very Deep Convolutional Networks for Large-Scale Image Recognition-VGGNet解读

VGGNet论文学习记录：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

VGGNet论文（Very Deep Convolutional Networks for Large-Scale Image Recognition）（译）

论文理解 - VGGNet - Very Deep Convolutional Networks for Large-Scale Image Recognition

论文阅读笔记--VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

论文笔记《Very Deep Convolutional Networks for Large-Scale Image Recognition》

VGGNet论文翻译-Very Deep Convolutional Networks for Large-Scale Image Recognition

经典论文阅读《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》简短阅读笔记

Very Deep Convolutional Networks for Large-Scale Image Recognition—VGG论文翻译

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION论文翻译

论文学习：（VGG）Very Deep Convolutional Networks for Large-scale Image Recognition

【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)