目标检测——在训练PyTorch模型遇到显存不足的情况怎么办？

其他 2020-04-01 14:31:03 阅读次数: 0

1 前言

在目标检测中，可能会遇到显存不足的情况，我们在这里记录一下解决方案；

2 如何减少PyTorch模型需要的显存

2.1 减小batch_size的数量

最小的数量可以设置为2；

2.2 使用checkpoint对模型进行优化

我觉得checkpoint优化PyTorch模型的原理，主要在于不保存中间过程中的激活值，

在checkpoint的文档中也是这样说的：

Checkpointing works by trading compute for memory. Rather than storing all intermediate activations of the entire computation graph for computing backward, the checkpointed part does not save intermediate activations, and instead recomputes them in backward pass. It can be applied on any part of a model.

用自洽性代码测试一下，为什么测试不成功？

网友ONE_SIX_MIX给出的简单例子：《torch.utils.checkpoint 简介和简易使用》

PyTorch官方在DenseNet中的写作实例，参见：vision/torchvision/models/densenet.py

2.3 可以减小分辨率

减小分辨率是节省显存的一种可行的做法，（但是南溪是不推荐这种做法的，如果实在显存不够，可以减小batch_size的大小，因为降低分辨率从本质上看，是对图像进行下采样，这样必然会丢失图像的原始信息，这是没有必要的）；

注意：在下采样输入图像进行训练时，对于标注数据不能进行下采样，否则会出现意想不到的错误；

这是可以理解的，因为作为loss函数，他只是一个改卷老师，他并不关心模型内部进行了怎样的处理，

他只关心：对于评分标准而言，你的回答是否是正确的；

所以我们在进行训练的时候，是不能对标注信息进行任何修改的，因为我们怎么能修改评分标准呢；

我们应该做的就是把预测数据的还原操作作为模型的一部分，放入模型的前向运算中，而不是去修改标注数据；

songyuc

发布了323 篇原创文章 · 获赞 97 · 访问量 34万+

私信关注

猜你喜欢

转载自blog.csdn.net/songyuc/article/details/104754557

目标检测——在训练PyTorch模型遇到显存不足的情况怎么办？

目标检测——当遇到GPU显存或者内存不够的情况该怎么办呢？

深度神经网络模型训练时GPU显存不足怎么办？

GPU 显存不足怎么办？

Spring遇到没注册依赖的情况怎么办！

python爬虫遇到IP被封的情况，怎么办？

项目管理，资源不足怎么办？

SEO流量纯度不足怎么办？

高速数据采集时，遇到“混叠”和“幅度分辨率不足”怎么办？

基于tensorflow训练模型的显存不足解决办法

使用pytorch训练自己的Faster-RCNN目标检测模型

5. 使用PyTorch预先训练的模型执行目标检测

写爬虫遇到Could not open CONNECT tunnel with proxy的情况怎么办

print(torch.cuda.is_available())为False，训练无法使用GPU的情况怎么办

python爬虫遇到‘由于目标计算机积极拒绝，无法连接。’该怎么办

NoSuchMethodError 遇到了怎么办

遇到Tomcat端口占用怎么办

遇到押金不退，该怎么办？

CodeChef 遇到 Language Rejected 怎么办

前端遇到瓶颈了怎么办？

遇到陌生的 Linux 命令怎么办

爬虫遇到521错误怎么办

面试遇到不会的怎么办？

苹果开发用的电脑空间不足怎么办

MDaemon磁盘空间不足，该怎么办

苹果电脑显示内存不足怎么办

Pytorch学习笔记(7)——模型放GPU上经常报CUDA错该怎么办

Pytorch跑深度学习显存不足的问题

使用pytorch实现预训练模型迁移学习中的目标检测

目标检测——PyTorch模型搭建模板

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)