pytorch使用指定GPU训练 - 代码天地

pytorch使用指定GPU训练

编程语言 2018-11-27 03:04:04 阅读次数: 0

本文适合多GPU的机器，并且每个用户需要单独使用GPU训练。

虽然pytorch提供了指定gpu的几种方式，但是使用不当的话会遇到out of memory的问题，主要是因为pytorch会在第0块gpu上初始化，并且会占用一定空间的显存。这种情况下，经常会出现指定的gpu明明是空闲的，但是因为第0块gpu被占满而无法运行，一直报out of memory错误。解决方案如下：

指定环境变量，屏蔽第0块gpu

CUDA_VISIBLE_DEVICES = 1 main.py

这句话表示只有第1块gpu可见，其他gpu不可用，此时要注意第1块gpu已经变成第0块，因此代码里应该使用编号0来指定gpu。如果依然使用cuda:1会报invalid device ordinal。
当然也可以在代码里使用os模块达到同样效果：

import os

#多块使用逗号隔开
os.environ['CUDA_VISIBLE_DEVICES'] = '1'

使用torch.cuda.device

with torch.cuda.device(1):
	...

注意这种情况下gpu编号也会改变

关于这个问题的讨论，感兴趣的也可以去这里查看cuda out of memory error when GPU0 memory is fully utilized

猜你喜欢

转载自blog.csdn.net/ax7399/article/details/84557410

pytorch使用指定GPU训练

pytorch使用指定的GPU

Pytorch：使用GPU训练

【环境配置】Pytorch指定使用GPU编号训练数据

PyTorch中使用指定的GPU

【pytorch】如何使用指定GPU

pytorch指定使用的单个GPU

pytorch指定使用的gpu设备

[转载]PyTorch中使用指定的GPU

pytorch使用多GPU训练MNIST

pytorch使用GPU训练MNIST数据集

pytorch 多GPU训练总结（DataParallel的使用）

pytorch使用horovod多gpu训练

Pytorch-如何使用GPU进行训练

pytorch使用多块GPU训练代码

pytorch-使用GPU加速模型训练

Pytorch下使用多GPU训练模型

pytorch框架学习(2)使用GPU训练

Pytorch - GPU ID 指定 pytorch gpu 指定

pytorch 使用单个GPU与多个GPU进行训练与测试

PyTorch指定GPU

[转] pytorch指定GPU

pytorch 多GPU 训练

【Pytorch】多GPU训练

pytorch多GPU训练

pytorch 多GPU训练

Tensorflow指定GPU训练

【Tensorflow】指定GPU训练

指定GPU训练模型

pytorch 使用指定的GPU RuntimeError: CUDA error: invalid device ordinal

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)