【深度学习】网络训练时train/val loss出现周期性剧增原因 - 代码天地

【深度学习】网络训练时train/val loss出现周期性剧增原因

企业开发 2023-12-18 00:21:44 阅读次数: 0

今天在训练自己定义的网络时，用Tensorboard观察Train/Val 的loss在训练时的变化，发现了下面loss会周期性剧增的情况：
train loss
val loss
通过观察loss具体的数值变化，我发现每次loss剧增都发生在一个epoch的最后一轮。

通过分析，我判断出这是由于我的图片数量不能被batch size整除导致的。

我的train/val分别有2450,610张图片，batch size为32，这使得每个epoch最后一次迭代的图片很少。

由于每轮训练的loss是所有图片loss的平均。当图片数量很少时，随机性更大，平均下来loss就更高了。

猜你喜欢

转载自blog.csdn.net/mooneve/article/details/97615814

【深度学习】网络训练时train/val loss出现周期性剧增原因

神经网络与深度学习---train_loss和val_loss(test_lost)分析

深度学习训练时网络不收敛的原因分析总结

深度学习中网络在训练时不收敛的原因

学习率周期性变化

职业技能的周期性学习

深度学习网络训练中出现loss函数为nan的原因

深度学习loss出现NAN的原因分析：

周期性学习率(Cyclical Learning Rate)技术

深度学习网络训练中出现nan的原因分析

训练深度学习网络时候，出现Nan原因总结

训练网络时出现误差loss 是 NAN

桌面周期性的出现debug文件

深度学习中训练时经常碰到的train、val、test有啥区别？

paddlepaddle 26 同时具备周期性与衰减性的学习率调度器

中国足球深度剖析之五，破除周期性怪圈

如何做年季度月日时的周期性报表的设计

Linux学习笔记21——周期性执行任务命令：crond教程

机器学习——随机森林特征选择及周期性分析

训练深度学习网络时候，出现Nan是什么原因

深度学习问题检查——训练出现nan, loss不降

周期性脚本

周期性总结

深度学习常用的工具（1）根据比率来随机生成训练的train.txt和val.txt

SparkStreaming之JobGenerator周期性任务数据处理逻辑源码深度剖析-Spark商业环境实战

【Loss为Nan】关于深度学习训练过程中出现Loss为Nan的问题

解决：模型训练时loss出现nan

对于训练时loss出现负值的情况

TI CC2530 学习笔记-15-NewBit-CC2530-ADC-外部电压周期性采集

训练模型时出现错误提醒：KeyError: ‘val_acc‘该怎么解决

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)