深度学习最常用的三个概念：Epoch, Batch, Iteration

编程语言 2023-04-10 06:32:39 阅读次数: 0

基本概念

在这里插入图片描述

Epoch（时期）：所有训练样本在神经网络中都进行了一次正向传播和一次反向传播

当一个Epoch的样本（也就是所有的训练样本）数量可能太过庞大（对于计算机而言），就需要把它分成多个小块，也就是就是分成多个Batch 来进行训练

Batch（批 / 一批样本）：将整个训练样本分成若干个Batch。
Batch_Size（批大小）：每批样本的大小。
Iteration（一次迭代）：训练一个Batch就是一次Iteration（这个概念跟程序语言中的迭代器相似）。
为什么要使用多于一个epoch?

在神经网络中传递完整的数据集一次是不够的，而且我们需要将完整的数据集在同样的神经网络中传递多次。但请记住，我们使用的是有限的数据集，并且我们使用一个迭代过程即梯度下降来优化学习过程。随着epoch数量增加，神经网络中的权重的更新次数也在增加，曲线从欠拟合变得过拟合。

换算公式

在这里插入图片描述

在这里插入图片描述

举例说明

mnist 数据集有30000张图片作为训练数据，10000张图片作为测试数据。假设现在选择 Batch_Size = 100对模型进行训练。迭代15000次。

每个 Epoch 要训练的图片数量：30000(训练集上的所有图像)
训练集具有的 Batch 个数： 30000/100=300
每个 Epoch 需要完成的 Batch 个数：300
每个 Epoch 具有的 Iteration 个数：300（完成一个Batch训练，相当于参数迭代一次）
每个 Epoch 中发生模型权重更新的次数：300
训练 10 个Epoch后，模型权重更新的次数： 300*10=3000

不同Epoch的训练，其实用的是同一个训练集的数据。第1个Epoch和第10个Epoch虽然用的都是训练集的30000图片，但是对模型的权重更新值却是完全不同的。因为不同Epoch的模型处于代价函数空间上的不同位置，模型的训练代越靠后，越接近谷底，其代价越小。

总共完成15000次迭代，相当于完成了15000/300=50个Epoch

猜你喜欢

转载自blog.csdn.net/Bluebro/article/details/127858572

深度学习最常用的三个概念：Epoch, Batch, Iteration

深度学习-三个概念：Epoch, Batch, Iteration

深度学习当中的三个概念：Epoch, Batch, Iteration

batch 、batch size、epoch、 iteration

batch、epoch、iteration

Batch, Iteration,Epoch概念理解

机器学习-概念之Epoch,Batch,iteration

深度学习中的batch、epoch、iteration的含义

深度学习中batch，iteration，epoch的含义

关于深度学习的 batch、iteration 和 epoch

epoch、 iteration和batch size

epoch， batch_size，iteration

batch size、iteration、epoch的含义

解释batch&&epoch&&iteration

Batch, Epoch, Iteration, Sample的区别

epoch,iteration,batch,batch_size

batch、batch_size、epoch、iteration简介

训练神经网络中最基本的三个概念和区别：Epoch, Batch, Iteration

机器学习基本概念：batch_size、epoch、 iteration

深度学习基础--epoch、iteration、batch_size

深度学习中的 epoch iteration batch-size

【CV】深度学习中Epoch, Batch, Iteration的含义

batch，iteration，epoch 什么意思

iteration 、epoch、batch_size详解

深度学习_深度学习基础知识_Epoch、Batch和Iteration概念

深度学习概念、参数理解：iteration, batch_size, epoch, learning rate, weight_decay

深度学习中epoch、batch、batch-size和iteration的理解

在机器学习中epoch, iteration, batch_size的区别

神经网络中的epoch、batch_size和iteration

Epoch、Batch和Iteration有什么区别？

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)