Pytorch学习参考链接 - 代码天地

Pytorch学习参考链接

其他 2020-01-18 10:39:26 阅读次数: 0

关于track_running_stats用法的说明

添加BN来训练的过程中，我们更新running_mean和running_var，但是我们为了保证输入输出的一致性，我们不希望在验证的时候，还对输入的数据来更新running_mean和running_var，track_running_stats=True表示的是在训练的时候更新running_mean和running_var，而在测试的时候，只是使用训练时练好的running_mean和running_var，可以见参考[2]

如果track_running_stats=False那么训练的时候就用训练的batch来更新running_mean和running_var，测试的时候还会使用测试的batch数据从新算running_mean和running_var。可以参考[3]和[4]

学习率调整策略

Pytorch的学习率调整策略，可以看参考[5]和参考[12]，特别是[12]中有很丰富的代码解释，如何具体应用这些学习率，特别是学习率衰减这方面。

权重初始化

权重初始化可以参考[6]

Batch Normalization和Instance Normalization

在这里插入图片描述
此图片来自于何凯明论文Group Normalization

我们从图中可以比较明显的看到BN和IN之间的区别，BN是将每一个batch的每一个通道的每一组图片求mean和var，而IN是将单独一个图片的一个通道的数据求mean和var。区别就是一个是对batch求，一个是对一个图片求。

这样的区别也导致各自应用领域不同。对于BN而言，主要用在判别模型部分。在分类任务中，对每一个batch进行归一化可以更好地保证数据分布的一致性。特别是当batch size比较大的时候，batch的数据更容易代表总体。

IN主要用在生成模型部分。因为生成部分更多的是依赖单独一张图像的实例，对整个batch归一化不适合图像风格化，在风格迁移中使用Instance Normalization不仅可以加速模型收敛，并且可以保持每个图像实例之间的独立。详情可以参考[7]和[8]

Gram矩阵

Gram矩阵简单解释可以看[9]，此外，我还写了一篇如何用代码简单实现Gram矩阵的计算，可以参考[10]

Reference

[1]彻底明白Python partial
[2]Why track_running_stats is not set to False during eval
[3]知乎：BatchNorm2d增加的参数track_running_stats如何理解？
[4]BatchNorm2d: How to use the BatchNorm2d Module in PyTorch
[5]PyTorch学习之六个学习率调整策略
[6]Pytorch：参数初始化笔记
[7]BN和IN的对比
[8]BatchNorm VS InstanceNorm
[9]风格迁移-风格损失函数(Gram矩阵)理解
[10]如何对batch的数据求Gram矩阵
[11]PatchGAN的理解和代码
[12]Pytorch中的学习率衰减方法

Einstellung 博客专家

发布了189 篇原创文章 · 获赞 233 · 访问量 36万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/Einstellung/article/details/101016891

Pytorch学习参考链接

学习参考链接

【PyTorch】PyTorch学习资料链接

pytorch学习链接

学习参考网站链接搜集整理

深度学习环境搭建-整理参考链接

参考链接

db2基本学习资料参考链接

ganglia+hadoop+hbase nagios 学习参考链接

吴恩达深度学习教程参考链接

【入坑篇】C++学习参考网站与链接

Thread [参考链接]

修改PE参考链接

zeromq安装参考链接

MultiBoot设计参考链接

实体链接参考

wordpress参考链接

Qt 参考链接

6.8. 参考链接

PCL：英文参考链接

pytorch资料链接汇总

学习+唐进民《深度学习之PyTorch实战计算机视觉》PDF+参考

yolov3参考链接

IDEA食用参考链接（临时）

diffusion model 常用参考链接

学习参考

学习神经网络中用到的有用参考链接

pytorch学习-WHAT IS PYTORCH

基于PyTorch的深度学习入门教程,1,2,3,4,,链接如下，

用github来搜索学习所需知识-PyTorch写的比较好的链接

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)