Tensorflow 3. 训练过程，出现loss=NAN的问题？ - 代码天地

Tensorflow 3. 训练过程，出现loss=NAN的问题？

其他 2019-04-14 17:30:57 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/princexiexiaofeng/article/details/79975964

① 问题可能原因：

1. 如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为学习率过高，需要降低学习率。我们可以不断降低学习率直至不出现NaN为止，一般来说低于现有学习率1→10倍即可；
2. 如果当前的网络是类似于RNN的循环神经网络的话，出现NaN可能是因为梯度爆炸的原因，一个有效的方式是增加“gradient clipping”（梯度截断来解决）；
3. 可能用0作为了除数；
4. 可能0或者负数作为自然对数；
5. 需要计算loss的数组越界（尤其是自定义了一个新的网络时，可能出现这种情况）；
6. 在某些涉及指数计算，可能最后算得值为INF（比如不做其他处理的softmax中分子分母需要计算exp(x)，值过大，最后可能为INF/INF，得到NaN，此时需要确认我们使用的softmax中计算exp(x)时做了相关处理（比如减去最大值等等））。

② 我遇到的问题和解决方法：

已经进行gradient clipping、计算过程没有出现0为除数；调整learning_rate=0.15→0.015、'adagrad_init_acc'=0.1→0.01之后，仍然报错loss=NAN；调整batch_size=1之后，报错内容为Training error: "TensorArray has size zero, but element shape <unknown> is not fully defined."；最后发现数据集中存在empty string，剔除空数据之后解决了。

猜你喜欢

转载自blog.csdn.net/princexiexiaofeng/article/details/79975964

Tensorflow 3. 训练过程，出现loss=NAN的问题？

3.利用Tensorflow进行回归问题的处理

【Loss为Nan】关于深度学习训练过程中出现Loss为Nan的问题

【tensorflow】训练网络loss突然出现nan的情况

Tensorflow训练网络出现了loss = NAN解决方案

TensorFlow学习——Tensorflow Object Detection API（3.模型训练篇）

tensorflow训练中出现nan问题

Tensorflow编程问题-Loss Nan

tensorflow-SSD算法在训练过程中出现的问题和解决方案

tensorflow训练中出现nan

tensorflow 3.滑动平均模型

深度学习框架TensorFlow（3.变量）

【Tensorflow object_detection API】使用iou loss训练时出现nan情况

tensorflow训练过程的日志与监控

Tensorflow 保存和载入训练过程

Tensorflow——可视化训练过程

Tensorflow学习笔记6：解决tensorflow训练过程中GPU未调用问题

解决tensorflow-gpu版本训练loss一直为nan，或者loss，accuracy数值明显不对问题

pytorch训练过程中loss出现NaN的原因及可采取的方法

faster rcnn训练过程出现loss=nan的解决办法

在训练过程中loss出现NaN的原因以及可以采取的方法

3. PyTorch中Tensorboard的使用（训练过程可视化）

【tensorflow】3.简单神经网络_MINIST

3. tensorflow TPU使用 UnimplementedError: File system scheme ‘[local]‘

tensorflow出现 nan

TensorFlow之tf.nn.dropout()：防止模型训练过程中的过拟合问题

bert训练过程3

tensorflow在训练过程中逐步减少学习率

tensorflow笔记：模型的保存与训练过程可视化

matplotlib实现TensorFlow训练过程的可视化

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)