【pytorch】DataLoader 和 Dataset 的使用

其他 2021-11-20 13:20:24 阅读次数: 0

加载顺序

pytorch中加载数据的顺序是：
①创建一个dataset对象
②创建一个dataloader对象
③循环调用dataloader对象，获取data,label数据拿到模型中去训练

Dataset

你需要自己定义一个class继承父类Dataset，其中至少需要重写以下3个函数：
①__init__：传入数据，或者加载数据
②__len__：返回这个数据集一共有多少个item
③__getitem__: 返回一条训练数据，并将其转换成tensor

示例代码：

class MyData(Dataset):

  def __init__(self, x_patches, y_patches, transform = None):
    self.y_patches = y_patches
    self.x_patches = x_patches
    self.transform = transform

  def __len__(self):
    return len(self.y_patches)

  def __getitem__(self, idx):
    y_image = self.y_patches[idx]
    x_image = self.x_patches[idx]

    y_image = np.asarray(y_image)
    x_image = np.asarray(x_image)

    y_image = Image.fromarray(y_image.astype(np.uint8))
    x_image = Image.fromarray(x_image.astype(np.uint8))

    if self.transform:
       y_image = self.transform(y_image)
       x_image = self.transform(x_image)

    return x_image, y_image

DataLoader

参数：
dataset：传入的数据
shuffle = True:是否打乱数据
collate_fn：这个参数可以自己操作每个batch的数据参考:Pytorch中DataLoader的使用_kahuifu的博客-CSDN博客

示例代码:

dataset = MyData(x_patches, y_patches, transform=transforms.Compose(
            [transforms.ToTensor(), 
             transforms.Normalize([0.5], [0.5])]))

bs = 16
data_loader = DataLoader(dataset, batch_size=bs, shuffle=True)
num_batches = len(data_loader)

调用DateLoader

最后循环调用dataloader ，拿到数据放入模型进行训练

for n_batch, (x_batch, y_batch) in enumerate(data_loader):

    x_data = x_batch.float().cuda()
    y_data = y_batch.float().cuda()

猜你喜欢

转载自blog.csdn.net/flyconley/article/details/119119817

【pytorch】DataLoader 和 Dataset 的使用

Pytorch对NLP的数据进行处理，使用Dataset和Dataloader方法

Dataset和DataLoader的使用

PyTorch中DataLoader与Dataset的使用、关系&原理

PyTorch中的Dataset、Dataloader和_DataloaderIter

Pytorch（五）入门：DataLoader 和 Dataset

PyTorch 入门实战（三）——Dataset和DataLoader

Pytorch自定义Dataset和DataLoader

Pytorch Dataset和DataLoader 加载训练数据

[Pytorch]DataSet和DataLoader逐句详解

pytorch中的dataset和dataloader是什么

pytorch中使用Dataset和DataLoader创建自定义数据集入门

使用Dataset 和DataLoader 加载数据集

Pytorch——DataSet与DataLoader

[Python] PyTorch之数据集(Dataset)和数据加载器(DataLoader)介绍，使用场景和使用案例

Pytorch加载自己的数据集(使用DataLoader读取Dataset)

pytorch Dataset数据集和Dataloader迭代数据集

pytorch中的dataset和DataLoader创建数据集进行训练

Pytorch进行自定义Dataset 和 Dataloader 原理

Dataset和DataLoader

Dataset 和 DataLoader

Pytorch-Dataset & DataLoader & Sampler

Pytorch教程[02]DataLoader与Dataset

深度之眼Pytorch打卡（七）：Pytorch数据读取机制，DataLoader()和Dataset

自己尝试__call__和yield实现pytorch底层的Dataset和dataloader的大致原理

【PyTorch修炼】二、带你详细了解并使用Dataset以及DataLoader

Pytorch学习（一） --- 数据加载之Dataset类和DataLoader类

CNN训练前的准备：pytorch处理自己的图像数据（Dataset和Dataloader）

Pytorch: 数据读取机制Dataloader与Dataset

pytorch --数据加载之 Dataset 与DataLoader详解

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)