pytorch自学笔记——线性回归

import numpy as np
import torch
from torch.utils import data #处理数据的模块
from d2l import torch as d2l

#生成数据集，这里可以不用看
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

#load_array这个函数的目的在于：小批量梯度下降法中，小批量的选取
#data_arrays=matrix，batch_size=小批量的个数，is_train=是否随机抽取这个小批量
def load_array(data_arrays, batch_size, is_train=True):
"""构造一个PyTorch数据迭代器。"""

dataset = data.TensorDataset(*data_arrays)

#data.DataLoader小批量的选取靠的就是这个函数
return data.DataLoader(dataset, batch_size, shuffle=is_train)

batch_size = 10
data_iter = load_array((features, labels), batch_size)

next(iter(data_iter))

#建造模型
from torch import nn
net = nn.Sequential(nn.Linear(2, 1))

#对模型中的参数进行初始化
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

#构建损失函数——nn.MSELoss()是均方损失
loss = nn.MSELoss()

#训练器——对模型的参数进行更新
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

#训练过程
num_epochs = 3 #num_epochs = 3 代表着我们对模型进行三次训练
for epoch in range(num_epochs):
for X, y in data_iter: #随机取出10个样本（小批量）去训练模型
l = loss(net(X), y) #计算损失
trainer.zero_grad() #梯度归零
l.backward() #求解最新梯度
trainer.step() #参数更新
l = loss(net(features), labels)
print(f'epoch {epoch + 1}, loss {l:f}')

函数解答：

1、data.TensorDataset可以用来对tensor进行打包。

更明白点来说就是将样本和lable合并起来（样本的个数于lable的长度必须一致）

input：连个相同长度的tensor

output：打包好的tensor

example：

a = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9]])
b = torch.tensor([44, 55, 66, 44, 55, 66, 44, 55, 66, 44, 55, 66])

# TensorDataset对tensor进行打包
train_ids = TensorDataset(a, b)
for x_train, y_label in train_ids:
print(x_train, y_label)

如何显示打包后的tensor：

for x_train, y_label in train_ids: 对样本和lable分开输出

next(iter(data_iter))：打包好的数据整体输出

2、 data.DataLoader(dataset, batch_size, shuffle=is_train)

对data.TensorDataset打包好的数据进行一个选取。

batch_size=选取样本的个数

shuffle=true随机选取，false顺序选取

pytorch自学笔记——线性回归

猜你喜欢