关于训练过程中损失函数出现断崖式增长的问题

企业开发 2023-04-08 15:03:37 阅读次数: 0

训练过程中损失函数出现断崖式增长原因

(一). 由于损失函数是非凸函数，学习率设置的过大导致跳出了最优解的区间，我们可以选择动态改变学习率的优化算法，比如adam

(二) 当训练过程中出现梯度爆炸也会导致损失出现断崖式增长

梯度爆炸或消失出现的原因

根本原因：当我们采取不当的训练方法啊导致前面的层出现梯度消失后，模型会大幅度调整后几层的参数，导致梯度过大，最后出现梯度爆炸

注意：梯度消失出现在前几层，梯度爆炸出现在后几层

解决措施

注意：梯度截断法也是防止梯度爆炸的重要手段
1. 选择合适的分布去初始化参数，w过大容易导致梯度爆炸或消失，比如使用tanh激活函数时候，w过大导致z过大，再求导时导数却趋于0

2. 采用BN方式，尽可能的使得输入输出保持同分布，减缓梯度消失得出现也能避免梯度爆炸或消失产生(非常好用)
3. 根据链式法则，当我们w的值较小时，a的导数也会较小，a的导数越小前一层w的梯度也就越小，所以我们可以采用L1、L2正则化的方式来减缓梯度爆炸
4. 选择合适的激活函数，relu就是我们最常用的激活函数
5. 效果差不多的情况下，神经网络越简单越不容易出现梯度爆炸和梯度消失

猜你喜欢

转载自blog.csdn.net/qq_42861526/article/details/124021989

关于训练过程中损失函数出现断崖式增长的问题

训练过程中，出现样本错误的问题

【Loss为Nan】关于深度学习训练过程中出现Loss为Nan的问题

SSD训练过程中出现问题总结

超分网络训练过程中val出现颜色变化的问题

解决Caffe训练过程中loss不变问题

训练过程中的一些问题

深度学习训练过程中的问题&解决

【yolox训练过程中遇到的问题集合】

Deep Learning 之训练过程中出现NaN问题

caffe ssd 训练过程中出现nan问题解决

tensorflow-SSD算法在训练过程中出现的问题和解决方案

pytorch训练过程中loss出现NaN的原因及可采取的方法

在训练过程中loss出现NaN的原因以及可以采取的方法

[解决]神经网络训练过程中loss中出现Non

实时绘制训练过程中损失和准确率的变化趋势 python keras jupyter notebook

Nanodet训练过程中出现全nan

在tensorflow分布式训练过程中突然终止（终止）

深度学习（21）——关于训练过程中loss和acc固若磐石

TensorFlow之tf.nn.dropout()：防止模型训练过程中的过拟合问题

Tensorflow学习笔记6：解决tensorflow训练过程中GPU未调用问题

在训练过程中跑验证集导致显存out of memory问题。

解决：pytorch-ssd在训练过程中遇到的一系列问题

压测过程中出现ops断崖式下跌原因及排解

tensorflow在训练过程中逐步减少学习率

tensorflow训练过程中内存溢出

CNN训练过程中的数据扩充方法

Tensorflow训练过程中查看某参数的值

神经网络训练过程中tips

REID 行人重识别训练过程中的trick

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)