机器学习超参数mini-batch（小批量）与正则化 - 代码天地

机器学习超参数mini-batch（小批量）与正则化

其他 2019-04-15 22:51:22 阅读次数: 0

1、一个epoch（周期）为所有数据完成一次前向与反向传播，iteration(迭代次数)为权重参数更新的次数，mini-batch（小批量）为一次权重参数更新所用的数据条数。迭代次数=数据总数／小批量，例如数据总数为2000条数据，小批量为500，那么一个周期内迭代次数=2000／500=4 ，如果是两个周期，那么迭代次数=2*（2000／500）=8

2、mini-batch越大，意味着计算量越大，梯度越平滑。但不是越大越好，权衡内存，计算量，优化效果。

3、mini-batch一般为2的次方，层的大小一般也为2的次方，这是由硬件特性造成的。

4、使用CPU进行训练时mini-batch一般为32到256，使用GPU进行训练时mini-batch一般为32 到1024

5、当你增大mini-batch时，迭代次数就会减少，那么参数更新次数也会减小，因此，要适当增加epoch的次数。

6、正则化是为了避免权重参数变化太快太大，以防过拟合。

7、L2更重地惩罚较大的权重，但不会将较小的权重减到0。L1对大权重的惩罚较小，但会导致许多权重被减少到0（或非常接近0），这意味着合成权重向量可以是稀疏的。

猜你喜欢

转载自blog.csdn.net/bewithme/article/details/86708991

机器学习超参数mini-batch（小批量）与正则化

机器学习：梯度下降(GD)，随机梯度下降(SGD), 小批量随机梯度下降(Mini-batch SGD)

深度学习优化函数详解（3）-- mini-batch SGD 小批量随机梯度下降

深度学习中的三种梯度下降方式：批量（batch），随机（stochastic），小批量（mini-batch）

吴恩达机器学习笔记60-随机梯度下降算法、小批量梯度下降算法（Stochastic Gradient Descent& Mini-Batch Gradient Descent）

梯度下降法(Gradient Descent)优化函数的详解（3）小批量随机梯度下降法（mini-batch SGD ）

梯度下降：全梯度下降算法(FG)、随机梯度下降算法(SG)、小批量梯度下降算法(mini-batch)、随机平均梯度下降算法(SAG)。梯度下降法算法比较和进一步优化。

局部最优、梯度消失、鞍点、海森矩阵(Hessian Matric)、批梯度下降算法(btach批梯度下降法BGD、小批量梯度下降法Mini-Batch GD、随机梯度下降法SGD)

【机器学习】搜索算法（梯度，随机梯度，次梯度，小批量，坐标下降）

mini-batch的理解

吴恩达机器学习（十五）大规模机器学习（Batch、Stochastic、Mini-batch gradient descent、MapReduce）

【深度学习】机器学习概述（二）优化算法之梯度下降法（批量BGD、随机SGD、小批量）

批梯度下降法(Batch Gradient Descent )，小批梯度下降 (Mini-Batch GD)，随机梯度下降 (Stochastic GD)

deeplearning.ai 改善深度神经网络(正则化、优化、mini-batch等)附代码作业答案

mini-batch梯度下降

神经网络算法学习---mini-batch

【深度学习】 BGD、SGD、mini-batch GD

batch、随机、Mini-batch梯度下降

小批量梯度下降法MBGD

deeplearning.ai学习笔记（6）—— 超参数调试、Batch正则化和程序框架

为什么小批量会可以使模型获得更大的泛化

超参数调试、Batch正则化和编程框架

2.3超参数调试，batch正则化以及Softmax回归

Mini-Batch 、Momentum、Adam算法的实现

对随机梯度下降+mini-batch的理解

GAN的优化（十三）：mini-batch discriminator

简单粗暴理解与实现机器学习线性回归（五）：梯度下降法介绍、全梯度下降算法FG、随机梯度下降算法SG、小批量梯度下降算法mini-bantch、随机平均梯度下降算法SAG、算法比较、梯度下降优化算法

【深度学习】线性回归（二）小批量随机梯度下降及其python实现

【深度学习】3-2 神经网络的学习- mini-batch学习

神经网络学习中的损失函数及mini-batch学习

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)