深度学习（DL）基本概念 - 代码天地

深度学习（DL）基本概念

其他 2018-09-13 18:09:00 阅读次数: 0

深度学习中的batchsize、epochs、learning rate、momentum、iteration/step几个术语，这里整理一下，

1.batchsize：批大小，每次训练给神经网络喂入的数据量大小（当然也可以一次将所有样本丢给神经网络）。但是要注意，batchsize并不是越大越好。更大的批量会计算更精确的梯度估计，但是回报却是小于线性的。同样，极小批量通常难以充分利用多核架构。
这里写图片描述
2.iteration/step：迭代（步），从总样本中每次拿batchsize数据量喂入神经网络，需要step次喂完毕。举个例子，总样本Total Sample=5000个，batchsize=100个，则 $step=\frac{total\ sample}{batchsize}=50$

3.epochs：轮数，指总样本被训练的次数，即将所有样本全部训练一次为一个epoch。注意，每次epoch之后，需要对总样本shuffle，再进入下一轮训练。
这里写图片描述
4.learning rate：学习率 $\epsilon$ (0,1)，是一个确定步长大小的正标量（一般设置的很小，如0.001），表示沿着梯度的方向一步迈多大。

5.momentum：动量，随机梯度下降(SGD)学习过程有时会很慢。比如在穿越山谷时，使用SGD则会在山谷壁来回的摆动（如下图）。动量算法积累了之前梯度指数级衰减的移动平均，并且继续沿该方向移动。 $v$ 表示动量，超参数 $\alpha$ [0,1) 决定了之前梯度的贡献衰减得有多快。

这里写图片描述

References:
[1] 怎么选取训练神经网络时的Batch size?
[2] 梯度下降优化算法综述
[3] Ian, Goodfellow, Yoshua, Bengio. 深度学习[M]. 北京:人民邮电出版社, 2017.

©qingdujun
2018-6-10 于北京怀柔

猜你喜欢

转载自blog.csdn.net/u012339743/article/details/80638500

深度学习（DL）基本概念

深度学习之学习笔记（二）—— AI / ML / DL的基本概念

【深度学习】基本概念

深度学习基本概念

深度学习：基本概念深度解析

[深度学习]tensorflow基本概念01

深度学习基本概念、思想

深度学习基本概念的了解

2 . 深度学习基本概念

深度学习中的基本概念

深度学习基本概念和CNN

深度强化学习的基本概念及基本算法

理解机器学习和深度学习的基本概念

【深度强化学习】强化学习的基本概念

【深度学习笔记】机器学习基本概念

深度学习的一些基本概念-CNN（1）

深度学习：卷积神经网络（CNN）基本概念

深度学习（Deep Learning）读书思考一：基本概念

（1）深度强化学习基础【基本概念】

ML/DL入门介绍（底层理解+基本概念）

学习深度学习--深度学习中的一些基本概念

集成学习基本概念

Tensorflow学习：基本概念

机器学习基本概念

机器学习：基本概念

机器学习的基本概念

JanusGraph学习-基本概念

RabbitMQ学习——基本概念

JavaScript学习------基本概念

ES学习——基本概念

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)