apex混合精度训练教程

企业开发 2023-07-25 21:20:12 阅读次数: 0

目录

前言
一.apex的安装
- 1.1.官方推荐
- 1.2.通过git下载文件安装
二.apex的使用

前言

使用混合精度训练可以减少显存开销，加快模型的训练速度。更详细的apex的优缺点可以参考这篇博文：Pytorch自动混合精度(AMP)训练。我们这里介绍的是单GPU的混合精度训练，多GPU的训练可以参考下这篇博文英伟达APEX，多GPU分布式训练，同步Batchnorm，自动混合精度训练法宝指南。

一.apex的安装

apex无法直接通过pip install apex来安装。下面介绍两种安装方法：
在安装之前请先安装git工具，这里附上链接：git工具下载，没有别的需求就直接一路next就行了，安装后记得配置环境变量，自行百度一下即可，很简单。

1.1.官方推荐

这种方法不是很推荐，试了几次都没成功，不知道原因在哪，有知道的伙伴，欢迎评论区留言。

git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./2.

1.2.通过git下载文件安装

通过此方法安装成功。这里也需要注意，需要在自己的python环境下面安装。

git clone https://github.com/NVIDIA/apex
cd apex
python setup.py install

二.apex的使用

apex的使用也比较简单，直接导入apex包在对模型和参数初始化，以及loss加入到apex中即可，下面给出示例：

模型和参数部分：

mdoel = Net()
optimizer = AdaXW(params, opt.lr, weight_decay=1e-4)
# 加上这句话即可
model, optimizer = amp.initialize(model, optimizer, opt_level="O1")  # 这里是“欧一”，不是“零一”

loss部分：

 loss = criterion(outputs, labels)
 		# loss后面加上这两句
        with amp.scale_loss(loss, optimizer) as scaled_loss:
            scaled_loss.backward()

猜你喜欢

转载自blog.csdn.net/qq_38683460/article/details/129925312

apex混合精度训练教程

『pytorch』Pytorch中的Distributed Data Parallel与混合精度训练（Apex）

【pytorch】基于Apex的混合精度加速

混合精度训练

amp（混合精度）训练-torch

深度学习：混合精度训练

全网最全-混合精度训练原理

混合精度是如何加速大模型训练的？

【深度学习】混合精度训练与显存分析

【Pytorch】理解自动混合精度训练

模型训练-Tricks-加速训练：混合精度

Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答

【百度、NVIDIA】混合精度训练 Mixed Precision Training

ResNet实战：单机多卡DDP方式、混合精度训练

【混合精度训练】 torch.cuda.amp.autocast()

【模型加速部署】—— Pytorch自动混合精度训练

mmdetection添加apex训练模型

模型训练过程中，混合精度训练稳定性解决方案

Oracle Apex 5.0安装教程

一行代码让训练速度提升2倍，飞桨自动混合精度技术详解

基于OpenSeq2Seq的NLP与语音识别混合精度训练

PyTorch 1.6 发布：原生支持自动混合精度训练并进入稳定阶段

代码实战带你了解深度学习中的混合精度训练

Pytorch自动混合精度详解

PyTorch的自动混合精度amp

20200523混合训练总结

GEE：随机森林分类教程（样本制作、训练、精度、参数优化、贡献度）

【PyTorch基础教程21】进阶训练技巧（损失函数、学习率、模型微调、半精度训练）

TensorRT笔记(6)使以混合精度工作

自动混合精度(AMP)介绍与使用【Pytorch】

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)