pytorch 多卡训练，模型保存的一些问题

企业开发 2022-03-23 10:34:03 阅读次数: 0

单显卡

先看单显卡如何实现训练：
第一步：检查环境内是否有cuda环境，如果有则将device 设置为cuda，如果没有则设置为cpu

 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

第二步：定义模型，并将模型放入device。

model = mobilenet_v3_large(pretrained=True)
model.to(DEVICE)

第三步：将数据放入device中

 for batch_idx, (data, target) in enumerate(train_loader):
        data, target = data.to(device, non_blocking=True), target.to(device, non_blocking=True)

第四步：保存模型

torch.save(model, 'model_.pth')

接下来，我们看看多显卡训练过程和单显卡有何不同

多显卡

第一步：检查环境内是否有cuda环境，如果有则将device 设置为cuda:0，如果没有则设置为cpu。

 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

第二步：定义模型，并将模型放入device。如果环境中有多张显卡，则使用torch.nn.DataParallel方法加载模型，实现多卡训练。

model = mobilenet_v3_large(pretrained=True)
model.to(DEVICE)
if torch.cuda.device_count() > 1:
    print("Let's use", torch.cuda.device_count(), "GPUs!")
    model = torch.nn.DataParallel(model)

第三步：将数据放入device中。数据默认加载到第一张显卡上。

 for batch_idx, (data, target) in enumerate(train_loader):
        data, target = data.to(device, non_blocking=True), target.to(device, non_blocking=True)

第四步：保存模型，判断是否是多张显卡训练出来的模型。如果是多张显卡训练的模型则要保存model.module。

 if isinstance(model, torch.nn.DataParallel):
                torch.save(model.module, 'model_.pth')
            else:
                torch.save(model, 'model_.pth')

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/123392741

pytorch 多卡训练，模型保存的一些问题

pytorch训练模型的一些坑

Pytorch多卡训练

pytorch实现分类遇到的一些问题

pytorch多GPU训练模型保存及加载

PyTorch 单机多卡训练

pytorch 多卡并行训练

Pytorch 训练一些要点记录

pytorch保存训练好的模型

PyTorch 模型保存，断点训练

pytorch训练模型保存与加载

pytorch 一些关于模型参数冻结的问题

pytorch模型训练单机多卡(一)：基础知识(模型并行 vs 数据并行

pytorch模型训练单机多卡(二)：数据并行DataParallel

Pytorch: What is Pytorch? (一)

使用pytorch构建神经网络的流程以及一些问题

pytorch-deeplab 运行调试过程中遇到的一些问题

Pytorch模型训练--模型保存与加载（3）

pytorch DistributedDataParallel多卡并行训练

Pytorch 多卡训练原理与实现

Pytorch 多卡并行训练教程（DDP）

使用Pytorch进行多卡训练

[Pytorch]Pytorch 保存模型与加载模型(转)

Pytorch的一些总结

Pytorch的一些坑

pytorch 的一些坑

pytorch的一些库

PyTorch的一些使用

[深度学习]让你的PyTorch模型更快地训练的一些技巧

pytorch模型保存

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)