深度学习网络训练中出现nan的原因分析 - 代码天地

深度学习网络训练中出现nan的原因分析

其他 2018-08-15 18:28:34 阅读次数: 0

nan:Not a Number

错误后果：造成训练准确率的断崖式下跌

两种出现地点：

1）在loss函数中出现nan

出现原因：一般是因为tf中的log函数输入了‘负数’或‘0’值（出现log(0)*0的情况）

解决方法：使用tf.clip_by_value限制tf.log的输入值

例如： cross_entropy = -tf.reduce_sum(y_*tf.log(tf.clip_by_value(y,1e-8,tf.reduce_max(y))))

cross_entropy = -tf.reduce_sum(y_*tf.log(tf.clip_by_value(y,1e-8,1e+100)))

cross_entropy = -tf.reduce_sum(y_*tf.log(y+1e-8))

safe_log = tf.clip_by_value(some_tensor, 1e-10, 1e100)

2）在更新网络时出现nan

出现原因：一般是学习率设置过高导致的（-->梯度值过大-->梯度爆炸）

解决方法：调低学习率

3）脏数据

出现原因:训练数据中存在脏数据，不适应当前网络，输出错误数值

解决方法：人工清理数据

更多细节可参考：

blog.sina.com.cn/s/blog_6ca0f5eb0102wr4j.html#cmt_5A0D972D-72F73880-BE365276-926-938

https://www.zhihu.com/question/49346370

https://www.zhihu.com/question/52242037/answer/184101547

https://www.cnblogs.com/bonelee/p/8603750.html

猜你喜欢

转载自blog.csdn.net/Strive_For_Future/article/details/81625006

深度学习网络训练中出现nan的原因分析

深度学习网络训练中出现loss函数为nan的原因

训练深度学习网络时候，出现Nan原因总结

训练深度学习网络时候，出现Nan是什么原因

深度学习loss出现NAN的原因分析：

【Loss为Nan】关于深度学习训练过程中出现Loss为Nan的问题

深度学习网络不收敛的原因分析总结

tensorflow训练中出现nan

深度学习网络的训练技巧

tensorflow训练中出现nan问题

深度学习训练时网络不收敛的原因分析总结

深度学习训练中cost突然出现NaN

深度学习问题检查——训练出现nan, loss不降

深度学习网络

深度学习出现nan问题

Caffe训练深度学习网络的暂停与继续

深度学习网络训练不收敛问题

caffe python接口搭建&训练深度学习网络

【深度学习】网络训练时train/val loss出现周期性剧增原因

Nanodet训练过程中出现全nan

训练网络出现loss为NaN的情况

训练网络时出现误差loss 是 NAN

深度学习网络 | GoogLeNet

初期深度学习网络

深度学习网络的发展

模型训练出现NaN的原因以及解决方法

VC中出现“烫烫烫”的原因分析

深度学习网络篇——VGGNet（Part1 网络结构&训练环节）

深度学习中网络在训练时不收敛的原因

《深度学习网络训练--第一讲》数据采集与数据预处理

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)