动手学深度学习4.3 多层感知机的简洁实现 - 代码天地

动手学深度学习4.3 多层感知机的简洁实现

企业开发 2021-11-16 13:16:54 阅读次数: 0

参与11月更文挑战的第13天，活动详情查看：2021最后一次更文挑战

手动实现多层感知机已经很简单了，现在看一下怎么用框架实现。依旧是实现一个两层模型：

可能有人会有疑问为什么这是两层模型，我看到的说法是有几层权重就是基层模型，并且我听了很多课都是称这种为两层模型，不过不用纠结，你非想叫三层模型那就叫。但是这里为了让我和我听的课保持思路一致我就称为两层模型。

import torch
from torch import nn
from d2l import torch as d2l
复制代码

net = nn.Sequential(nn.Flatten(),
                    nn.Linear(784, 256),
                    nn.ReLU(),
                    nn.Linear(256, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);
复制代码

net =
- 设定模型，先对输入进行展开，将其变换为向量
- 输入层到隐藏层是784→256
- 设定ReLU层激活函数
- 设定隐藏层到输出层
init_weights给每一层初始化权重
将init_weights应用到net上。

batch_size, lr, num_epochs = 256, 0.1, 10
loss = nn.CrossEntropyLoss()
trainer = torch.optim.SGD(net.parameters(), lr=lr)
复制代码

这里batch_size是设定mini-batch的批量大小为256，lr设定learning-rate为0.1，num_epochs设定迭代次数为10
训练过程也是直接使用框架自带的SGD

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)
复制代码

在这段代码中会出现手动实现softmax回归中提到的用户警告。可以直接忽略。从手动实现softmax那一节开始这个问题就一直伴随着我了，但是我直接忽略了。想知道警告原因以及怎么解决可以看这里：torchvision.transforms.ToTensor详解 | 使用transforms.ToTensor()出现用户警告 - 掘金 (juejin.cn)

训练过程的实现与我们实现softmax回归时完全相同，这种模块化设计使我们能够将与和模型架构有关的内容独立出来。

更多可以看这里：《动手学深度学习》 - LolitaAnn的专栏 - 掘金 (juejin.cn)

猜你喜欢

转载自juejin.im/post/7029874806770106404

动手学深度学习4.3 多层感知机的简洁实现

MXNet动手学深度学习笔记：多层感知机

动手学深度学习(二)——多层感知机(gluon)

动手学深度学习三---多层感知机MLP

动手学深度学习-多层感知机

动手学深度学习——多层感知机

《动手学深度学习》（3）多层感知机

动手学深度学习PyTorch（四）：多层感知机

《动手学深度学习》——多层感知机

【动手学深度学习】李沐——多层感知机

《动手实现深度学习》笔记（三）多层感知机

【动手学深度学习Pycharm实现5】多层感知机的简单实现

MXNet动手学深度学习笔记：Gluon实现多层感知机

动手学深度学习(PyTorch实现)(五)--多层感知机

多层感知机 + 代码实现 - 动手学深度学习v2 pytorch

动手学深度学习笔记（六）——多层感知机及实现

动手学深度学习（三、深度学习基础--多层感知机、基础知识）

《动手学深度学习+PyTorch》3.9多层感知机（MLP）从零开始实现学习笔记

动手学深度学习学习笔记tf2.0版（3.8: 多层感知机）

动手学深度学习(二)——多层感知机(从零开始)

《动手学深度学习》系列笔记—— 1.3 多层感知机

【动手学深度学习】---0x04：多层感知机

【Datawhale动手学深度学习笔记】多层感知机代码实践

【AI】《动手学-深度学习-PyTorch版》笔记（十四）：多层感知机

动手深度学习10- pytorch多层感知机从零实现

第3章(3.8～3.10节)多层感知机实现【深度学习基础】--动手学深度学习【Tensorflow2.0版本】

多层感知机的简洁实现

机器学习：多层感知机原理及实现

动手学深度学习4.6 dropout简洁实现

ElitesAI·动手学深度学习PyTorch版学习笔记-线性回归；Softmax与分类模型、多层感知机

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)