【目标检测】SPP-Net网络 - 代码天地

【目标检测】SPP-Net网络

企业开发 2023-12-16 17:40:08 阅读次数: 0

引言

SPP-Net网络是一种深度学习网络结构，它最大的特点是可以接受任意尺寸的输入图像。在SPPNet之前，大部分的神经网络都需要输入固定尺寸的图片，这对于不同尺寸的图片检测带来了许多不便，因为需要对图片进行缩放、裁剪等一系列操作，这在一定程度上会导致图片信息的丢失和变形，限制了识别的精确度。

SPP-Net简介

SPP-Net是出自论文：《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》。

在此之前，所有的神经网络都是需要输入固定尺寸的图片，比如224*224（ImageNet）、32*32(LenNet)、96*96等。这样对于我们希望检测各种大小的图片的时候，需要经过crop，或者warp等一系列操作，这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。而且，从生理学角度出发，人眼看到一个图片时，大脑会首先认为这是一个整体，而不会进行crop和warp，所以更有可能的是，我们的大脑通过搜集一些浅层的信息，在更深层才识别出这些任意形状的目标。

SPP-Net对这些网络中存在的缺点进行了改进，基本思想是，输入整张图像，提取出整张图像的特征图，然后利用空间关系从整张图像的特征图中，在spatial pyramid pooling layer提取各个region proposal的特征。SPPNet通过空间金字塔池化（Spatial Pyramid Pooling，简称SPP）的方法。这种方法的主要思想是将任意尺寸的图片经过卷积层后得到的特征图划分为不同尺寸的小块，然后对每个小块进行池化操作，这样就可以得到固定长度的输出，从而解决了输入图像尺寸不定的问题。

一个正常的深度网络由两部分组成，卷积部分和全连接部分，要求输入图像需要固定size的原因并不是卷积部分而是全连接部分。所以SPP层就作用在最后一层卷积之后，SPP层的输出就是固定大小。

SPP-net不仅允许测试的时候输入不同大小的图片，训练的时候也允许输入不同大小的图片，通过不同尺度的图片同时可以防止overfit。相比于R-CNN提取2000个proposal，SPP-net只需要将整个图扔进去获取特征，这样操作速度提升了100倍左右。

猜你喜欢

转载自blog.csdn.net/AI_dataloads/article/details/134385067

【目标检测】SPP-Net网络

目标检测：SPP-net

目标检测系列（二）：SPP-Net

论文翻译—SPP-Net（目标检测）

目标检测之SPP-Net

SPP-Net目标检测算法深度剖析

简要介绍一下目标检测的网络，r-cnn, spp-net, fast-rcnn, faster-rcnn

深度篇——目标检测史(三) 细说 SPP-Net 目标检测

深度学习目标检测(object detection)系列（二） SPP-Net

目标定位和检测系列（4）：金字塔池化（SPP-net）

【目标检测】SPP-Net (Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

目标检测学习总结之RCNN、SPP-net、Fast RCNN、Faster RCNN、YOLO、SSD的区别

目标检测从入门到精通—SPP-Net详细解析（三）

目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN

目标检测模型以及一些网络R-CNN、SPP-NET、Fast R-CNN、Faster R-CNN

【深度学习】卷积神经网络应用之双阶段目标检测｜R-CNN、SPP-Net、Fast-RCNN、Faster-RCNN

SPP-NET解读

SPP-Net

Spp-Net Pytorch

SPP-Net——"空间金字塔池化" (目标检测)(one-stage)(深度学习)(ECCV 2014)

目标检测学习笔记1----R-CNN/SPP-Net/Fast R-CNN/Faster R-CNN

神经网络的认识（八）SPP-NET

SPP-net SPP-net原理解读

SPP-Net：对RCNN的改进

SPP-net解读转发

Spp-net解读（一）

【深度学习】目标检测 R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN, R-FCN ，YOLO, SSD

SPP-Net 论文笔记

SPP-net论文学习

SPP-net文章详细解读

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)