Pytorch半精度浮点型网络训练问题

其他 2018-12-20 13:34:42 阅读次数: 0

用Pytorch1.0进行半精度浮点型网络训练需要注意下问题：

1、网络要在GPU上跑，模型和输入样本数据都要cuda().half()

2、模型参数转换为half型，不必索引到每层，直接model.cuda().half()即可

3、对于半精度模型，优化算法，Adam我在使用过程中，在某些参数的梯度为0的时候，更新权重后，梯度为零的权重变成了NAN，这非常奇怪，但是Adam算法对于全精度数据类型却没有这个问题。

　　另外，SGD算法对于半精度和全精度计算均没有问题。

还有一个问题是不知道是不是网络结构比较小的原因，使用半精度的训练速度还没有全精度快。这个值得后续进一步探索。

猜你喜欢

转载自www.cnblogs.com/yanxingang/p/10148712.html

Pytorch半精度浮点型网络训练问题

如何使用 PyTorch 进行半精度、混(合)精度训练

pytorch1.0 半精度训练 Adam RMSprop 优化器 Nan 问题

Pytorch半精度训练（以两层BP网络为例）与正常训练对比及loss可视化

pytorch 半精度hlaf()

pytorch 半精度half()

BigDecimal解决浮点型运算中丢失精度的问题

关于js浮点型数据运算精度丢失问题

Bigdecimal解决浮点型商业运算中丢失精度的问题

js浮点型计算精度问题及解决办法

PHP浮点精度问题

记录PyTorch中半精度amp训练出现Nan的排查过程

【PyTorch基础教程21】进阶训练技巧（损失函数、学习率、模型微调、半精度训练）

C/C++ 控制浮点型精度

关于BigDecimal的精度浮点型计算

浮点数精度问题

Scala浮点运算精度问题

浮点数的精度问题

浮点类型丢失精度的问题

单片机C语言float浮点型运算中精度的问题

[C&C++]半精度浮点误差实验

双-单-半精度浮点数的细节

Pytorch处理数据与训练网络问题汇总（协同训练）

php 浮点数精度运算问题

js浮点运算精度丢失问题

golang浮点数精度问题

PHP浮点数精度损失问题

java浮点数运算精度问题

js浮点数精度问题

javascript中浮点运算精度问题

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)