机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大 - 代码天地

机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大

其他 2021-12-12 02:46:22 阅读次数: 0

问题

10个epoch，运行到最后一个时，训练数据集的损失函数显著增大
在这里插入图片描述

解决步骤

检查learning rate，发现学习率平滑减小，符合预期没有问题
检查梯度截断是否有效。梯度上没有问题。
检查adam之外的优化方法。adam没有问题
检查数据集是否shuffle。

结论

事实证明问题确实出在tensorflow的数据流水线上。如果把epoch的部分增加到这里，则整体是平滑的

def __call__(self, annotations_dir, batch_size=8, shuffle=False):
        self.data_reader = DataReader(annotations_dir)
        dataset = tf.data.Dataset.from_generator(self.data_reader.iter,
                                                 output_types=(tf.float32, tf.float32),
                                                 output_shapes=([self.img_size, self.img_size, 3], [None, 5]))  # for distribute data
        dataset = dataset.repeat(10)

如果是写到自己的训练循环里，则有问题

for epoch in range(10):
        for image_data, target in trainset:
            train_step(image_data, target)
        model.save_weights("../weights/yolov5")

其实，如果是经验丰富，大概一开头就可以猜出大概的解决方案，不用像我到处检测。因为问题出在一个新的epoch开头时突然异样。由于对tf.data原理了解的不多，问题的实质还需要更多实验和理论才能搞清楚了。

猜你喜欢

转载自blog.csdn.net/weixin_38812492/article/details/111680101

机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大

一个Epoch前几个batch正常训练，最后一个batch的数据不足报错

人工智能实践：Tensorflow笔记01：一个最简单的神经网络分析及前向传播，损失函数，梯度下降及学习率，tensorflow一些编程变量

[机器学习]利用TensorFlow训练一个简单的神经网络

机器学习之--损失函数（一）

在PyTorch训练一个epoch时，模型不能接着训练，Dataloader卡死

机器学习之路： tensorflow 自定义损失函数

机器学习损失函数

机器学习-损失函数

Python机器学习--训练一个分类器

用PyTorch训练一个简单的机器学习模型

tensorflow/keras 模型搭建以及第一个epoch速度极慢的问题

TensorFlow入门：第一个机器学习Demo

tensorflow学习笔记——损失函数

TensorFlow入门：第一个机器学习Demo TensorFlow入门：第一个机器学习Demo

机器学习（一）TensorFlow训练参数

机器学习最常用的5个回归损失函数

Tensorflow计算一个五层神经网络带L2正则化的损失函数

机器学习面试—损失函数

机器学习中的损失函数

机器学习常用损失函数

【机器学习】常用损失函数

【机器学习】各种损失函数

机器学习损失函数讲解

机器学习常用的损失函数

【机器学习算法】——> 损失函数

【机器学习】损失函数MAE

机器学习：Loss损失函数

[机器学习]损失函数DLC

机器学习之损失函数

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)