pytorch nn.Modlue及nn.Linear 源码理解 - 代码天地

pytorch nn.Modlue及nn.Linear 源码理解

其他 2018-11-01 07:29:19 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/dss_dssssd/article/details/82977170

先看一个列子：

import torch
from torch import nn

m = nn.Linear(20, 30)
input = torch.randn(128, 20)
output = m(input)

output.size()

out:

torch.Size([128, 30])

刚开始看这份代码是有点迷惑的，m是类对象，而直接像函数一样调用m，m(input)

重点：

nn.Module 是所有神经网络单元（neural network modules）的基类
pytorch在nn.Module中，实现了__call__方法，而在__call__方法中调用了forward函数。

经过以上两点。上述代码就不难理解。

接下来看一下源码：
https://github.com/pytorch/pytorch/blob/master/torch/nn/modules/module.py

在这里插入图片描述

再来看一下nn.Linear
https://pytorch.org/docs/stable/_modules/torch/nn/modules/linear.html
主要看一下forward函数：
在这里插入图片描述

返回的是：
$input * weight + bias$ 的线性函数

此时再看一下这一份代码：

import torch
from torch import nn

m = nn.Linear(20, 30)
input = torch.randn(128, 20)
output = m(input)

output.size()

首先创建类对象m，然后通过m(input)实际上调用__call__(input)，然后__call__(input)调用
forward()函数，最后返回计算结果为：
$[128, 20] \times [20, 30] = [128, 30]$

所以自己创建多层神经网络模块时，只需要在实现__init__和forward即可.

接下来看一个简单的三层神经网络的例子：

# define three layers
class simpleNet(nn.Module):

    def __init__(self, in_dim, n_hidden_1, n_hidden_2, out_dim):
        super().__init__()
        self.layer1 = nn.Linear(in_dim, n_hidden_1)
        self.layer2 = nn.Linear(n_hidden_1, n_hidden_2)
        self.layer3 = nn.Linear(n_hidden_2, out_dim)

    def forward(self, x):
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)

        return x

以下为各层神经元个数：
输入： in_dim
第一层： n_hidden_1
第二层：n_hidden_2
第三层（输出层）：out_dim

猜你喜欢

转载自blog.csdn.net/dss_dssssd/article/details/82977170

pytorch nn.Modlue及nn.Linear 源码理解

pytorch系列： nn.Modlue及nn.Linear 源码理解

[转载]Pytorch中nn.Linear module的理解

pytorch中nn.linear

PyTorch : nn.Linear() 详解

PyTorch的nn.Linear（）详解

PyTorch的nn.Linear()详解

Pytorch|nn.Linear()维度问题

【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()

nn.linear()函数

nn.linear()的用法

pytorch系列 ---5以 linear_regression为例讲解神经网络实现基本步骤以及解读nn.Linear函数

理解Pytorch里面nn.CrossEntropyLoss的含义

Pytorch：torch.nn.Parameter理解

Pytorch nn.BCEWithLogitsLoss()的简单理解与用法

nn.Dropout、DropPath的理解与pytorch代码

pytorch api torch.nn.Linear

「Deep Learning」理解Pytorch中的「torch.nn」

PyTorch之 torch.nn.Embedding 词嵌入层的理解

Pytorch nn.functional.unfold()的简单理解与用法

深度之眼pytorch打卡（四）| 台大李宏毅机器学习 2020作业（一）：线性回归，实现多因素作用下的PM2.5预测（Pytorch版手写+nn.Linear()）

torch.nn.Linear()函数的理解

torch.nn.Linear()函数理解

Pytorch框架学习 -2 torch.nn.modules.Module(nn.Module)理解

pytorch torch.nn

pytorch nn.embedding

pytorch:nn.Softmax()

pytorch:nn.BatchNormal

【pytorch】nn.Embedding()

【PyTorch】nn.Embedding

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)