常见的深度学习参数初始化方法总结

其他 2020-02-11 10:40:46 阅读次数: 0

目录

1 随机初始化

2 Xavier初始化

4 高斯随机初始化 with Batch Norm

在这里插入图片描述

1 随机初始化

2 Xavier初始化

每层的权重初始化公式如下：
在这里插入图片描述
上式为一个均匀分布，n_j为输入层的参数，n_(j+1)为输出层的参数

Xavier的推导过程是基于几个假设的，

其中一个是激活函数是线性的，这并不适用于ReLU，sigmoid等非线性激活函数；

另一个是激活值关于0对称，这个不适用于sigmoid函数和ReLU函数它们不是关于0对称的。

3 He初始化

Xavier初始化没有考虑激活函数，在某些非线性激活函数上表现不好（大部分激活函数都是有效的），如Relu。因此针对Relu推导了一次，与上面过程类似，只是方差要除以2。

每层的权重初始化公式如下：
在这里插入图片描述
为一个均值为0方差为2/n的高斯分布。

4 高斯随机初始化 with Batch Norm

5 Pre-train

在实际训练中，我们可以选择一个backbone网络，在其基础上做改动。该网络如果有一个已经训练好的在任务A上的模型（称为pre-trained model），可以直接将其放在任务B上做模型调整（称为fine-tuning）。

Reference

深度学习-六种权重初始化

一文详解深度学习参数初始化(weights initializer)策略

一枚小码农

发布了74 篇原创文章 · 获赞 17 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_25394043/article/details/104127522

常见的深度学习参数初始化方法总结

pytorch:常见的pytorch参数初始化方法总结

Oracle 常见初始化参数

深度学习模型参数初始化的方法

深度学习中的参数初始化

[深度学习] 网络参数初始化

深度学习笔记-参数初始化

深度学习之参数初始化

【深度学习】初始化参数

深度学习的Xavier初始化方法

jquery 3种常见的初始化方法

权重初始化的常见方法

深度模型中的优化与参数初始化方法

【深度学习_2.1.1】神经网络参数初始化

深度学习之参数初始化策略

深度学习-网络参数初始化Xavier与MSRA

【深度学习】参数初始化与Batch Normalization

深度学习记录（2） - 激活函数与参数初始化

深度学习理论 —— 初始化、参数调节

深度学习之参数初始化（一）——Xavier初始化

深度学习参数初始化（二）Kaiming初始化含代码

深度学习参数初始化（一）Xavier初始化含代码

深度学习：初始化

深度学习－网络Xavier初始化方法

Pytorch总结八之深度学习计算（1）模型构造，参数访问、初始化和共享

Pytorch总结七之深度学习的正向、反向传播原理+参数初始化+实战房价预测

CNN/RNN网络各自参数含义、如何初始化参数，BP计算以及常见超参数调整策略。。。。

tensorflow中的参数初始化方法

tensorflow的几种参数初始化方法

pytorch参数初始化方法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)