[解决]神经网络训练过程中loss中出现Non

企业开发 2023-09-30 16:20:06 阅读次数: 0

该循环中batch_size=64,取

i=0-->[0, 63],

i=64-->[64, 127]

....

训练正常，当进行到

i=320-->[320, 383]的循环中，loss出现nan的情况

原因：梯度爆炸

reference该文章讲的较为清晰，我只是从表面概括下

可以发现，在i=256时，梯度的参数出现较大的情况，如

e+16,e+17等较大的值

方法

batch_size=64--->改为32

注：我只尝试了这一种方法，同样也可以调整学习率、对数据集进行归一化、标准化处理等方法，要是改变batch_size的方法失效，我再试试其他方法，到时再来补充。

猜你喜欢

转载自blog.csdn.net/azheng02/article/details/130521767

[解决]神经网络训练过程中loss中出现Non

神经网络训练过程中tips

神经网络训练过程loss注意事项

【Loss为Nan】关于深度学习训练过程中出现Loss为Nan的问题

解决Caffe训练过程中loss不变问题

神经网络训练过程中不收敛或者训练失败の原因

神经网络训练过程中不收敛或者训练失败的原因

从MAP角度理解神经网络训练过程中的正则化

神经网络训练过程概述

pytorch训练过程中loss出现NaN的原因及可采取的方法

在训练过程中loss出现NaN的原因以及可以采取的方法

SSD训练过程中出现问题总结

Nanodet训练过程中出现全nan

caffe ssd 训练过程中出现nan问题解决

tensorflow-SSD算法在训练过程中出现的问题和解决方案

DeepID训练过程中loss居高不下解决方法

卷积神经网络（CNN）的训练过程

尝试理解神经网络训练过程

超分网络训练过程中val出现颜色变化的问题

训练过程中，出现样本错误的问题

神经网络训练算法的调用,神经网络训练过程图解

训练图像识别神经网络,神经网络训练过程图解

深度学习训练过程中的问题&解决

Deep Learning 之训练过程中出现NaN问题

Py_R_FCN 训练过程中出现 KeyError: 'max_overlaps' 错误

深度学习（21）——关于训练过程中loss和acc固若磐石

faster rcnn训练过程出现loss=nan的解决办法

关于深度卷积神经网络训练过程中一开始准确率就是1的问题

Tensorflow 3. 训练过程，出现loss=NAN的问题？

训练神经网络的过程中主要概念-学习笔记

今日推荐

周排行

django中south支持多数据库

2、实时同步项目

http协议状态码解析

codeup 又一版 A+B(C++)

js三座大山之外的其他知识点

正向代理VS反向代理总结

规范的测试流程（转自51testing）

3、python-连接sql server

转~Jenkins pipeline：pipeline 使用之语法详解

cookie与sessio系列（一）：基本知识入门

每日归档

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)