Pytorch GPU 显存溢出 Out of Memory 如何处理 - 代码天地

Pytorch GPU 显存溢出 Out of Memory 如何处理

业界资讯 2023-07-26 04:52:46 阅读次数: 0

在不修改网络结构的情况下, 有如下操作：

同意 @Jiaming , 尽可能使用inplace操作，比如relu 可以使用 inplace=True 。一个简单的使用方法，如下：

def inplace_relu(m): 
    classname = m.__class__.__name__
    if classname.find('ReLU') != -1: 
        m.inplace=True #model.apply(inplace_relu)

2.进一步，比如ResNet 和 DenseNet 可以将 batchnorm 和relu打包成inplace，在bp时再重新计算。使用到了pytorch新的checkpoint特性，有以下两个代码。由于需要重新计算bn后的结果，所以会慢一些。

3. 每次循环结束时删除 loss，可以节约很少显存，但聊胜于无。可见如下issue

Tensor to Variable and memory freeing best practices

4. 使用float16精度混合计算。我用过 @NVIDIA英伟达 apex，很好用，可以节约将近50%的显存，但是要小心一些不安全的操作如 mean和sum，溢出fp16。

补充：最近我也尝试在我CVPR19的GAN模型中加入fp16的训练，可以从15G的显存需求降到约10G，这样大多数1080Ti等较为常见的显卡就可以训练了。欢迎大家star一波 https://github.com/NVlabs/DG-Net

5. 对于不需要bp的forward，如validation 请使用 torch.no_grad , 注意model.eval() 不等于 torch.no_grad() 请看如下讨论。

'model.eval()' vs 'with torch.no_grad()'

6. torch.cuda.empty_cache() 这是del的进阶版，使用nvidia-smi 会发现显存有明显的变化。但是训练时最大的显存占用似乎没变。大家可以试试。

How can we release GPU memory cache?

另外，会影响精度的骚操作还有:

把一个batchsize=64分为两个32的batch，两次forward以后，backward一次。但会影响 batchnorm等和batchsize相关的层。

相关链接：老外写的提高pytorch效率的方法，包含data prefetch等

Optimizing PyTorch training code

最后感谢大家看完～欢迎关注分享点赞～也可以check我的一些其他文章

郑哲东：【新无人机数据集】从行人重识别到无人机目标定位

郑哲东：利用Uncertainty修正Domain Adaptation中的伪标签

郑哲东：用CNN分100,000类图像

郑哲东：NVIDIA/悉尼科技大学/澳洲国立大学新作解读：用GAN生成高质量行人图像，辅助行人重识别

猜你喜欢

转载自blog.csdn.net/Layumi1993/article/details/106218563

Pytorch GPU 显存溢出 Out of Memory 如何处理

【pytorch】 GPU显存充足out of memory解决办法

pytorch优化显存使用，避免out of memory

pytorch 减小显存消耗，优化显存使用，避免out of memory

运行pytorch发生CUDA out of memory显存不足解决

运行pytorch 显存充足却显示OOM（out of memory）

pytorch CUDA out of memory

CUDA out of memory in pytorch

CUDA out of memory in pytorch

pytorch解决RuntimeError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0； 4.00 G

【转】Pytorch：cuda out of memory

Pytorch 训练与测试时爆显存(out of memory)的一个解决方案

【Debug记录】CUDA out of memory.|显存不足|xx GiB reserved in total by PyTorch

显存充足 RuntimeError: CUDA error: out of memory

CUDA out of memory（CUDA显存不足）

PyTorch out of memory 解决方案

pytorch中cuda out of memory问题

当使用POI打开Excel文件遇到out of memory时该如何处理？

pytorch 测试时候显存溢出

Android Out Of Memory(OOM)内存溢出

关于OpenCV报错：“Error: Gpu API call (out of memory) in ”的解决

烦人的pytorch gpu出错问题：RuntimeError: CUDA out of memory. Tried to allocate 14.00 MiB 远程主机间复制文件及文件夹

烦人的pytorch gpu出错问题：RuntimeError: CUDA out of memory. Tried to allocate 14.00 MiB 远程主机间复制文件及文件夹

明明显存足够但是报错CUDA out of memory的问题

(node.js)webpack打包报javaScript heap out of memory,内存溢出，如何解决

pytorch 在验证时出现CUDA error: out of memory

pytorch 验证模型阶段出现CUDA error: out of memory

pytorch multi-task error: cuda out of memory

pytorch在推理时出现CUDA error: out of memory

Pytorch——代码导致的异常报错：RuntimeError: CUDA out of memory.

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)