Depth-wise Convolution keras 运行时间缓慢原因 - 代码天地

Depth-wise Convolution keras 运行时间缓慢原因

其他 2021-03-23 13:04:59 阅读次数: 0

提到depth-wise conv2D 大家都如数家珍，这里我就简单的介绍一下，用两张图就可以概述出来了，大家想要看具体的介绍可以看

A Basic Introduction to Separable Convolutions 这篇文章介绍的很清楚。

上图是一个正常的卷积操作，是一个12×12×3的特征图经过256个卷积核大小为5×5×3的卷积得到了一个8×8×256的特征图。这是正常的卷积。参数量为256 x 5 x 5 x 3 = 19200，乘法次数为256 x 5 x 5 x 3 x 8 x 8 = 1228800。

上图就是一个depthwisie-conv2D 卷积了。可以看到它采用了3个5×5×1的卷积核来操作得到3个8×8 ×3的特征图。其参数量

3 x 5 x 5 x 1 乘法次数为3 x 5 x 5 x 1 x 8 x 8。我们可以看到参数量核乘法次数大大降低了。下面是一个 Point-wise Conv.的操作。这两个加起来就是一个Separable Conv 了。

我们可以看到这两个卷积操作加起来的参数量和正常的卷积操作比起来大大降低了参数量。那么我们是不是可以直接用这个了。都有这么多优点了为啥我见到的用的人比较少昵。当我们使用keras 中的depthwiseconv2D 操作时这个时候发现网络的运行速度大大降低了。不是说好参数量减少了，不是说运行速度提升呀。这个问题我也时一直疑惑的。直到我看到这个文章。

Flops与模型的推理速度。这个文章解释的很清楚了。简单来说，depth-wise卷积的FLOPs更少没错，但是在相同的FLOPs条件下，depth-wise卷积需要的IO读取次数是普通卷积的100倍，因此，由于depth-wise卷积的小尺寸，相同的显存下，我们能放更大的batch来让GPU跑满，但是此时速度的瓶颈已经从计算变成了IO。自然desired小尺寸卷积应该有的快速的特性，也无法实现。

看到这里我终于明白为啥一些大组喜欢用这个卷积了，因为他们有很好的机器的，可以更好的发挥depthwiseconv2D 网络的性能了。

猜你喜欢

转载自blog.csdn.net/nijiayan123/article/details/106938955

Depth-wise Convolution keras 运行时间缓慢原因

Depth-wise Convolution 和 Point-wise Convolution 以及 Depth-wise Separable Convolution

【深度学习】Global Pooling，Depth-wise Convolution， Concatenate

keras中Convolution1D的使用

keras下Convolution1D与Convolution2D的区别

CVPR 2020| Dynamic Convolution动态卷积(keras实现)

convolution

CNN中卷积操作十大改进方向（Depth-wise/ Dilated/ Deformable/ Shuffle/ SENet etc）

tensorflow/keras指定运行时显卡及限制GPU用量

keras错误记录：tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm

详解Keras(tf)报错:"BaseCollectiveExecutor::StartAbort Unknown: Failed to get convolution algorithm"

Keras训练模型报错：Failed to get convolution algorithm. This is probably because cuDNN failed to initialize

Partial convolution && Gated convolution

keras02 - hello convolution neural network 搭建第一个卷积神经网络

keras中Convolution1D的使用（CNN情感分析yoom例子四） && Keras 1D,2D,3D卷积

keras进行时间序列预测

MACOS 运行Keras报错

keras 时间序列分析

运行时间

Strided convolution

Correlation and Convolution

Convolution in Caffe

Dilated Convolution

Transposed Convolution

Deconvolution 与convolution

Gated Convolution

keras

Keras运行GAN实例（2022.2.25）

Keras LSTM 时间序列预测

时间序列预测之keras

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)