为什么深度学习图像分类的输入多是224*224

其他 2021-03-06 03:20:09 阅读次数: 0

为什么深度学习图像分类的输入多是224*224？

文章目录

前言
总结

前言

做过图像分类项目或者看过文章的小伙伴们应该都知道，在论文中进行各类方法的比较时，要求使用同样的数据集。而为了公平的比较，网络的输入大小通常都是224*224的大小，那为什么呢？有同学思考过这个问题吗？

我们都知道，一个图像分类模型，在图像中经历了下面的流程

从输入image->卷积和池化->最后一层的feature map->全连接层->损失函数层softmax loss。

在这里插入图片描述
从输入到最后一个卷积特征feature map，就是进行信息抽象的过程，然后就经过全连接层/全局池化层的变换进行分类了，这个feature map的大小，可以是3×3，5×5，7×7等等。

解答1：在这些尺寸中，如果尺寸太小，那么信息就丢失太严重，如果尺寸太大，信息的抽象层次不够高，计算量也更大，所以7*7的大小是一个最好的平衡。

另一方面，图像从大分辨率降低到小分辨率，降低倍数通常是2的指数次方，所以图像的输入一定是7*2的指数次方。以ImageNet为代表的大多数分类数据集，图像的长宽在300分辨率左右。

解答2：所以要找一个7×2的指数次方，并且在300左右的，其中7×2的4次方=7×16=112，7×2的5次方等于7×32=224，7×2的6次方=448，与300最接近的就是224了。

这就是最重要的原因了，当然了对于实际的项目来说，有的不需要这么大的分辨率，比如手写数字识别MNIST就用32*32，有的要更大，比如细粒度分类。

在这里插入图片描述
看到一个这么回到，感觉虽然不是

总结

转载公众号：有三AI

猜你喜欢

转载自blog.csdn.net/weixin_43183872/article/details/109179104

为什么深度学习图像分类的输入多是224*224

深度学习之图像分类

深度学习中图像预处理为什么要减去图像均值

【涨知识】PCB板为什么多是绿色的？

【图像处理】为什么CNN需要固定输入图像的尺寸

无监督深度学习图像分类思路

深度学习_DBN模型_图像分类

深度学习：图像分类网络简介

深度学习图像预处理——分类

【从传统方法到深度学习】图像分类

深度学习在图像分类中的发展

TensorFlow深度学习（二）——图像分类

【深度学习】图像分类之KNN算法

深度学习图像分类（八）：FractalNet

深度学习图像分类（二）：AlexNet

深度学习图像分类（七）：DenseNet

深度学习图像分类（五）： ResNet

深度学习图像分类（三）： VggNet

深度学习--猫狗图像分类

深度学习图像分类（九）：SENet

使用深度学习模型进行图像分类

深度学习中的图像分类介绍

深度学习和高光谱图像分类

【机哥】深度学习医学图像分类

基于深度学习的图像分类与分类算法研究

3、深度学习为什么火起来？

深度学习中为什么使用卷积？

深度学习--为什么要深？

深度学习笔记之为什么是SoftMax

为什么是神经网络&深度学习

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)