Pytorch——DataLoader(批训练)

其他 2020-03-13 10:45:52 阅读次数: 0

文章目录

1.前言
2.DataLoader

1.前言

Pytorch 中提供了一种帮你整理你的数据结构的好东西, 叫做 DataLoader, 我们能用它来包装自己的数据, 进行批训练。

2.DataLoader

DataLoader 是 torch 给你用来包装你的数据的工具. 所以你要将自己的 (numpy array 或其他) 数据形式装换成 Tensor, 然后再放进这个包装器中. 使用 DataLoader 有什么好处呢? 就是他们帮你有效地迭代数据

import torch
from torch.utils.data import DataLoader, TensorDataset
torch.manual_seed(1)

BATCH_SIZE = 4     #意味着一个epoch有两个迭代
x = torch.linspace(1,20,20)
y = torch.linspace(20,1,20)

torch_dataset = TensorDataset(x,y)      

loader = DataLoader(
    dataset = torch_dataset,
    batch_size = BATCH_SIZE,
    shuffle = True,
    num_workers = 4
)

for epoch in range(3):
    for step , (batch_x, batch_y) in enumerate(loader):    #stepb表示一个eopch中的迭代次数
        print('Epoch:',epoch, '|Step:',step,'|batch x:',batch_x.numpy(),'|batch y:',batch_y.numpy() )

在这里插入图片描述
可以看出, 每步都导出了4个数据进行学习. 然后每个 epoch 的导出数据都是先打乱了以后再导出.(通过shuffle = True控制)

真正方便的还不是这点. 如果我们改变一下 BATCH_SIZE = 8, 这样我们就知道, step=0 会导出8个数据, 但是, step=2 时数据库中的数据不够 8个, 这时怎么办呢:
在这里插入图片描述
这时, 在 step=1 就只给你返回这个 epoch 中剩下的数据就好了.

程旭员

发布了125 篇原创文章 · 获赞 348 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_37763870/article/details/104829575

Pytorch——DataLoader(批训练)

Pytorch 批训练

pytorch实现批训练

批训练（pytorch）

PyTorch批训练

Pytorch Dataset和DataLoader 加载训练数据

pytorch批训练数据构造

PyTorch学习（8）—批训练

pytorch的dataloader

pytorch:DataLoader

pytorch 6 batch_train 批训练

pytorch学习之七批训练

详解PyTorch批训练及优化器

pytorch Dataset, DataLoader产生自定义的训练数据

pytorch中的dataset和DataLoader创建数据集进行训练

在PyTorch训练一个epoch时，模型不能接着训练，Dataloader卡死

Pytorch 快速入门（五）保存与提取，批训练

pytorch1.0批训练神经网络

pytorch白话入门笔记1.8-批数据训练

pytorch 函数DataLoader

pytorch的DataLoader使用细节

聊聊pytorch中的DataLoader

【pytorch】Dataloader 细节

PyTorch之DataLoader杂谈

pytorch之DataLoader()函数

PyTorch DataLoader()使用

【Pytorch】函数DataLoader

Pytorch——DataSet与DataLoader

pytorch之DataLoader

Pytorch学习笔记-DataLoader

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)