研究total loss与val loss以及预训练权重

企业开发 2023-06-24 20:40:31 阅读次数: 0

一、total loss与val loss

loss：训练集整体的损失值。
val loss：验证集（测试集）整体的损失值。
我们在训练的一个模型的时候，我们都会把一个样本划分成训练集、验证集。一般来说，我们按照训练集：验证集==9:1 来划分，那么当我们在训练模型计算出来的loss值就会分为：

训练集总体total loss 和测试集val loss。两者之间有大致如下的关系：

当loss下降，val_loss下降：训练正常，最好情况。

当loss下降，val_loss稳定：网络过拟合化。这时候可以添加Dropout和Max pooling。

当loss稳定，val_loss下降：说明数据集有严重问题，可以查看标签文件是否有注释错误，或者是数据集质量太差。建议重新选择。

当loss稳定，val_loss稳定：学习过程遇到瓶颈，需要减小学习率（自适应网络效果不大）或batch数量。

当loss上升，val_loss上升：网络结构设计问题，训练超参数设置不当，数据集需要清洗等问题，最差情况。

二、实际验证：

因为自己制作数据集少（只有30张训练集和10张验证集），目前没有gpu因此epoch只设置了10. 所以收敛效果不好，但是可以说明情况。

三、还有使用预训练权重和不使用区别：

四、损失函数：L1 loss, L2 loss, smooth L1 loss

L2-loss收敛速度比L1-loss快得多，缺点是当存在离群点（outliers)的时候，这些点会占loss的主要组成部分。

smooth L1：稍微缓和一点绝对损失函数（损失），它是随着误差线性增长，而不是平方增长。

smooth L1和L1-loss函数的区别在于，L1-loss在0点处导数不唯一，可能影响收敛。smooth L1的解决办法是在0点附近使用平方函数使得它更加平滑。

"L1 loss that is less sensitive to outliers than the L2 loss used in R-CNN and SPPnet."

也就是smooth L1 loss让loss对于离群点更加鲁棒，即：相比于L2损失函数，其对离群点、异常值（outlier）不敏感，梯度变化相对更小，训练时不容易跑飞。

猜你喜欢

转载自blog.csdn.net/m0_63172128/article/details/129317147

研究total loss与val loss以及预训练权重

keras中loss与val_loss的关系

Total Variation loss

TensorFlow中loss与val_loss、accuracy和val_accuracy分别是什么含义

KeyError: ‘val_acc‘ KeyError: ‘val_accuracy ‘ val_loss

神经网络与深度学习---train_loss和val_loss(test_lost)分析

GAN的Loss的比较研究（5）——能量Loss

【深度学习】网络训练时train/val loss出现周期性剧增原因

loss

Tips--TensorFlow报错：tensorflow:Early stopping conditioned on metric `val_loss` which is not available

GAN的Loss的比较研究（4）——Wasserstein Loss理解（2）

GAN的Loss的比较研究（3）——Wasserstein Loss理解（1）

GAN的Loss的比较研究（2）——传统GAN的Loss的理解2

GAN的Loss的比较研究（1）——传统GAN的Loss的理解1

训练优化：降低loss

mxnet训练loss输出

训练loss变成nan

【Tensorflow与深度学习笔记day12】6.2. 模型接口建立+6.3. 训练以及高级会话函数+input代码 inference代码 total_loss代码 train代码完整代码+主训

train loss and tes loss

Insertion Loss & Return Loss

笔记 - 模型训练：正则Loss

训练时 loss 为 NaN

keras 预训练模型finetune,多模型ensemble，修改loss函数，调节学习率

目标检测 YOLOv5的loss权重，以及与图像大小的关系

loss function

euclidean loss

Loss函数

Triplet Loss

Hinge loss

Minimum Loss

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)