Pytorch学习（十九）--- 模型中buffer的使用

其他 2018-09-22 22:46:59 阅读次数: 0

版权声明：要转随便转，如果能加上原文的链接就感谢各位了。( ⊙ o ⊙ ) https://blog.csdn.net/Hungryof/article/details/82017595

总说

我们知道，pytorch一般情况下，是将网络中的参数保存成OrderedDict形式的。这里额参数其实包括2种。一种是模型中各种 module含的参数，即nn.Parameter，我们当然可以在网络中定义其他的nn.Parameter参数。；另外一种是buffer。前者每次optim.step会得到更新，而不会更新后者。

例子

class myModel(nn.Module):
    def __init__(self, kernel_size=3):
        super(Depth_guided1, self).__init__()
        self.kernel_size = kernel_size
        self.back_end = torch.nn.Sequential(
            torch.nn.Conv2d(3, 32, 3, padding=1),
            torch.nn.ReLU(True),
            torch.nn.Conv2d(3, 64, 3, padding=1),
            torch.nn.ReLU(True),
            torch.nn.Conv2d(64, 3, 3, padding=1),
            torch.nn.ReLU(True),
        )

        mybuffer = np.arange(1,10,1)
        self.mybuffer_tmp = np.randn((len(mybuffer), 1, 1, 10), dtype='float32')
        self.mybuffer_tmp = torch.from_numpy(self.mybuffer_tmp)
        # register preset variables as buffer
        # So that, in testing , we can use buffer variables.
        self.register_buffer('mybuffer', self.mybuffer_tmp)

        # Learnable weights
        self.conv_weights = nn.Parameter(torch.FloatTensor(64, 10).normal_(mean=0, std=0.01))
        # Other code
        def forward(self):
            ...
            # 这里使用 self.mybuffer!

知识点：
I. 定义Parameter和buffer都只需要传入 Tensor即可。也不需要将其转成gpu。这是因为，当网络进行 .cuda()时候，会自动将里面的层的参数，buffer等转换成相应的GPU上。

II. self.register_buffer可以将tensor注册成buffer，在forward中使用self.mybuffer, 而不是self.mybuffer_tmp.

III. 网络存储时也会将buffer存下，当网络load模型时，会将存储的模型的buffer也进行赋值。

IV. buffer的更新在forward中，optim.step只能更新nn.Parameter类型的参数。

猜你喜欢

转载自blog.csdn.net/Hungryof/article/details/82017595

Pytorch学习（十九）--- 模型中buffer的使用

【AI】《动手学-深度学习-PyTorch版》笔记（十九）：卷积神经网络模型（GoogLeNet、ResNet、DenseNet）

pytorch中的register_buffer

Pytorch学习之十九种损失函数

Pytorch中Module,Parameter和Buffer的区别

pytorch中register_buffer的作用

pytorch的学习和使用

【pytorch学习笔记1】pytorch入门使用

使用pytorch实现预训练模型迁移学习中的目标检测

使用pytorch实现预训练模型迁移学习中的图像分类

PyTorch学习（一）--线性模型

[pytorch、学习] - 4.1 模型构造

机器学习----PyTorch模型训练

Pytorch学习 (十二) ----- Pytorch中如何使用Tensor Comprehensions

python3 14.tensorflow中模型保存和恢复方法之protocol_buffer模式学习笔记

系统学习深度学习（二十九）--模型压缩

pytorch学习(十九)—Visdom可视化训练过程

pytorch学习笔记（十九）：二维卷积层

pytorch学习笔记（三十九）：Fine-Tuning

[深度学习]Pytorch中RNN/LSTM模型小结

学习笔记|Pytorch使用教程27(模型保存与加载)

学习笔记|Pytorch使用教程28(模型finetune)

pytorch使用hiddenlayer深度学习模型可视化

PyTorch学习笔记-现有网络模型的使用及修改

【深度学习】实验12 使用PyTorch训练模型

Pytorch中的强化学习

Pytorch学习中遇到的问题

PyTorch中Tensor的学习笔记

pytorch学习笔记（更新中）

Python机器学习（七十九）Keras 评估模型

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)