深度学习（二）卷积计算 - 代码天地

深度学习（二）卷积计算

编程语言 2018-12-07 01:30:03 阅读次数: 0

写在前面：所有关于深度学习的基础知识均为鄙人的笔记分享，很多内容摘自大神们的博客或论文，因时间太长记不清了分别来自哪里。若有侵权，请联系鄙人邮箱[email protected]

目前，卷积的计算大多采用间接计算的方式，主要有以下三种实现方式：

im2col + GEMM。 caffe等很多框架中都使用了这种计算方式，原因是将问题转化为矩阵乘法后可以方便的使用很多矩阵运算库（如MKL、openblas、Eigen等）。
FFT变换。时域卷积等于频域相乘，因此可将问题转化为简单的乘法问题。
Winograd。这种不太熟悉，据说在GPU上效率更高。 NNPACK就是FFT和Winograd方法的结合。

上面三种方法执行效率都还不错，但对内存占用比较高，因为需要存储中间结果或者临时辅助变量。

im2col + GEMM 原理

darknet中应用了与caffe一样的函数

下面传有两个动图形象说明

å·ç§¯ç¥ç»ç½ç»

注意！！！！：

1 多通道多卷积操作计算过程

如图5，输入图像layer m-1有4个通道，同时有2个卷积核w1和w2。对于卷积核w1，先在输入图像4个通道分别作卷积，再将4个通道结果加起来得到w1的卷积输出；卷积核w2类似。所以对于某个卷积层，无论输入图像有多少个通道，输出图像通道数总是等于卷积核数量！

缩进对多通道图像做1x1卷积，其实就是将输入图像于每个通道乘以卷积系数后加在一起，即相当于把原图像中本来各个独立的通道“联通”在了一起。

2 卷积核计算过程

1、首先，假设输入图片大小是 224*224*3（224是图像宽或高，3是三个通道，也就是RGB三种）

2、然后，假设conv1层的是 7*7*96 （7*7是卷积核的size k，96是卷积核的个数n），stride = 2；

3、所以conv1得到的结果是110*110*96（[(w-k+pad)/stride+1] * [(h-k+pad)/stride+1] * n）（这个110来自于 (224-7+pad)/2+1 = 110 ，这个pad是我们常说的填充，也就是在图片的周围补充像素，这样做的目的是为了能够整除，除以2是因为2是图中的stride）；

4、再做一次池化pooling，得到pool1，池化的核的大小是3*3，所以池化后图片的维度是55*55*96 （ (110-3+pad)/2 +1 =55 ）；

猜你喜欢

转载自blog.csdn.net/u013247002/article/details/84855817

深度学习（二）卷积计算

深度学习-卷积计算

卷积池化计算深度学习

【深度学习基础】卷积是如何计算的

MXNet动手学深度学习笔记：卷积计算

深度学习图片卷积输出大小计算公式

【深度学习】多通道图像卷积过程及计算方式

深度学习图像卷积后的尺寸计算公式

深度学习-图片卷积输出大小计算公式

【深度学习】卷积计算与训练模型的几种方法

【深度学习】卷积层与池化层的参数计算

深度学习中卷积的参数量与计算量

深度学习入门基础CNN系列——卷积计算

跟姥爷深度学习6 卷积网络的数学计算

深度学习-conv卷积

深度学习—卷积的理解

深度学习《图像卷积》

深度学习—各种卷积

卷积神经网络入门（深度学习准备二）

深度学习入门笔记（十九）：卷积神经网络（二）

【深度学习】卷积神经网络的卷积层和池化层计算

卷积核输出特征图大小的计算深度学习经过卷积后的大小变化公式：

卷积神经网络之卷积计算、作用与思想深度学习

深度学习（二）神经网络中的卷积和反卷积原理

深度学习基础--卷积计算和池化计算公式

深度学习中的卷积与反卷积

深度学习：卷积和反卷积

深度学习基础--卷积--反卷积(deconvolution)

深度学习基础--卷积--加速的卷积运算

卷积神经网络(CNN)张量(图像)的尺寸和参数计算(深度学习) 卷积神经网络(CNN)张量(图像)的尺寸和参数计算(深度学习)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)