NN模型设置--减小训练时的内存/显存占用

编程语言 2018-12-04 12:40:16 阅读次数: 0

1）kennel_stride

一种技术是使用较大的步幅来进行卷积内核，也就是说，我们应用不是每个像素的平铺卷积，而是每两个或四个像素（stride为2或4），以便产生较少的输出数据。
这通常用于输入层，因为这些使用大部分内存。
当然，大stride通常是配合大的kenel_size一起使用；而使用大的kenel_size是为了扩大感受野。
为什么在第一层的stride要这么大？

2）1*1kennel_size

减少内存占用的另一个技巧是引入1×1的卷积内核层，减少通道。例如64x64x256输入可以通过96 1×1内核减少到64x64x96的输入。

3）pooling

一个明显的技术是池化。一个2×2的池化层可以将该层的数据量减少4个，从而显着减少后续层的内存占用。
下采样：(NCHW -> (1/4)*NCHW)

4）batch_size

使用批量大小为64而不是128个内存消耗量。然而，培训也可能需要更长时间，特别是训练的最后阶段，使得准确的梯度变得越来越重要。大多数卷积操作也针对64或更大的小批量尺寸进行优化，从而从批量大小32开始，训练速度大大降低。因此，将小批量尺寸缩小到甚至低于32，只能作为最后的选择。

5）float32

另一个经常被忽视的选择是更改卷积网络使用的数据类型。通过从32位切换到16位，可以轻松地将内存消耗量减半，而不会降低分类性能。在P100特斯拉卡上，这甚至会给你一个巨大的加速。

6）减少全连接层

一般只留最后一层分类用的全连接层。

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/84784600

NN模型设置--减小训练时的内存/显存占用

tensorflow使用GPU训练时的显存占用问题

（转）tensorflow使用GPU训练时的显存占用问题

解决pytorch训练时的显存占用递增的问题

设置占用显存大小&&显存动态增长

Ubuntu chrome显存占用设置

python显示GPU信息，以及pytorch训练时，自动分配显存占用低的GPU

使用多线程监听模型训练过程中实际显存占用nvidia-smi

pytorch计算模型的显存占用率和节省内存技巧

pytorch 减小显存消耗，优化显存使用，计算模型的中间变量

tensorflow 设置显存占用自增长

深度神经网络模型训练时GPU显存不足怎么办？

使用 GPU 版本的 TensorFlow 训练模型时，遇到 GPU 显存分配的错误

限制tensorflow训练时的显存设置，以及可见显卡号

【已证实】训练神经网络时，GPU利用率低而显存占用率高的思考

让tensorflow在GPU上训练时不要占用全部内存

Ubuntu下CPU+内存、GPU+显存占用监控

CNN卷积神经网络模型的GPU显存占用分析

NN模型设置--损失函数的设置

[NLP]LLM 训练时GPU显存耗用量估计

基于tensorflow训练模型的显存不足解决办法

pytorch 减小显存消耗，优化显存使用，避免out of memory

当显存不够时是否会调用共享GPU内存？

查看Python 代码的内存和模型显存消耗以及优化

Oracle设置“服务”占用内存

设置Redis最大占用内存

NN模型设置--设计新的layer或op

NN模型设置--网络局部模块设计

NN模型设置--参数初始化

NN模型设置--基于alexnet的实例分析

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)