深度学习理论 —— 初始化、参数调节 - 代码天地

深度学习理论 —— 初始化、参数调节

企业开发 2023-07-02 00:04:03 阅读次数: 0

初始化

深度学习模型训练的过程本质是对参数w进行更新，这需要每个参数有相应的初始值。

为什么要初始化?
神经网络要优化一个非常复杂的非线性模型，而且基本没有全局最优解，初始化在其中扮演着非常重要的作用。
□ 初始点的选取，有时能够决定算法是否收敛；
□ 当收敛时，初始点可以决定学习收敛的多快，是否收敛到一个代价高或低的点；
□ 过大的初始化导致梯度爆炸，过小的初始化导致梯度消失。

什么是好的初始化?
好的初始化应该满足以下两个条件：
□ 让神经元各层激活值不会出现饱和现象；
□ 各层激活值也不能为0。

全零初始化：参数初始化为0。
缺点：同一层的神经元会学习到相同的特征，不能破坏不同神经元的对称性质。
如果神经元的权重被初始化为0，所有神经元的输出都将是相同的，除了输出之外，所有的中间层的节点的值都为零。一般神经网络拥有对称的结构，那么在进行第一次误差反向传播时，更新后的网络参数将会相同，在下一次更新时，相同的网络参数学习提取不到有用的特征，因此深度学习模型都不会使用0初始化所有参数。

参数调节

批量 batchsize 选择2的指数倍与计算机内存相符

超参数调节方法

试错法、网络搜索、随机搜索、贝叶斯优化、高斯过程

猜你喜欢

转载自blog.csdn.net/m0_54776464/article/details/125964724

深度学习理论 —— 初始化、参数调节

【深度学习理论】(4) 权重初始化，Batch Normalization

深度学习理论——目标函数（损失函数）&正则化&交叉验证

深度学习理论——基本结构（池化层&激活函数&全连接层）

深度学习理论——过拟合、欠拟合、正则化、优化器

深度学习中的参数初始化

[深度学习] 网络参数初始化

深度学习笔记-参数初始化

深度学习之参数初始化

【深度学习】初始化参数

深度学习理论

机器学习理论之正则化

深度学习理论——Softmax

深度学习之参数初始化（一）——Xavier初始化

深度学习参数初始化（二）Kaiming初始化含代码

深度学习参数初始化（一）Xavier初始化含代码

【深度学习_2.1.1】神经网络参数初始化

深度学习之参数初始化策略

深度学习模型参数初始化的方法

深度学习-网络参数初始化Xavier与MSRA

常见的深度学习参数初始化方法总结

【深度学习】参数初始化与Batch Normalization

深度学习记录（2） - 激活函数与参数初始化

计算学习理论中泛化误差的研究

深度学习：初始化

pytorch学习:初始化权重并对整个网络的参数进行初始化

深度学习理论——logistic回归算法

深度学习理论——AdaBoost算法

深度学习理论——简述Bagging & Stacking

深度学习理论解析与实战应用

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)