DataLoader PyTorch 主要参数的含义 - 代码天地

DataLoader PyTorch 主要参数的含义

企业开发 2023-09-03 11:28:30 阅读次数: 0

定义：

DataLoader类是一个用于从数据集（dataset）中加载数据，并以迭代器（iterator）的形式返回数据样本（data samples）的工具¹²。您给出的两个字典（dictionary）分别是训练集（train set）和测试集（test set）的数据加载参数，下面我会逐一解释它们的含义和默认值：

举例演示：

假设prefetch_factor=2，batch_size=4，persistent_workers=True,你的回答里面的每个worker每次获取多少数据呢？

假设您有一个名为train_dataset的数据集，它包含了100个数据样本，每个样本由一个特征向量和一个标签组成。您可以使用以下代码创建一个使用prefetch_factor=2，batch_size=4，persistent_workers=True的DataLoader对象：

train_dataloader = torch.utils.data.DataLoader(train_dataset, batch_size=4, num_workers=8, prefetch_factor=2, persistent_workers=True)

小提示：

pin_memory将数据样本保存在锁页内存，这里的内存指的是cpu的内存还是gpu的内存？

pin_memory参数是一个布尔值，表示是否将数据样本保存在锁页内存（pinned memory）中。这里的内存指的是CPU的内存，而不是GPU的内存 1 2。

降低内存占用，推到的时候用到：

testloader_params = {
          'batch_size': 1,
          'shuffle': False,
          'num_workers': 0,
          'pin_memory': True,
          # 'prefetch_factor': 4,
          # 'persistent_workers': True,
          'drop_last': False
}

猜你喜欢

转载自blog.csdn.net/u010087338/article/details/132434265

DataLoader PyTorch 主要参数的含义

pytorch的dataloader

pytorch:DataLoader

pytorch 函数DataLoader

pytorch的DataLoader使用细节

聊聊pytorch中的DataLoader

【pytorch】Dataloader 细节

pytorch之DataLoader()函数

PyTorch之DataLoader杂谈

PyTorch DataLoader()使用

Pytorch——DataLoader(批训练)

【Pytorch】函数DataLoader

Pytorch——DataSet与DataLoader

pytorch之DataLoader

Pytorch学习笔记-DataLoader

Pytorch Dataloader加速

pytorch中的DataLoader

pytorch 中Dataloader中的collate_fn参数

[备忘录]pytorch dataloader参数collate_fn详解

PyTorch Lecture 08: PyTorch DataLoader

pytorch之dataloader深入剖析

PyTorch1.0中的Dataloader

Pytorch-Dataset & DataLoader & Sampler

用于DataLoader的pytorch数据集

pytorch的dataloader没法进行迭代

PyTorch中的Data.DataLoader

【pytorch】DataLoader 和 Dataset 的使用

pytorch出现‘DataLoader‘ object is not callable。

Pytorch教程[02]DataLoader与Dataset

pytorch创建data.DataLoader时，参数pin_memory的理解

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)