pytroch创建自己的Dataset和Dataloader.

版权声明:转载注明出处 https://blog.csdn.net/york1996/article/details/84141034

首先是引入需要的模块:

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader

然后继承Dataset类,重写它的三个方法:

class PointDataSet(Dataset):
    def __init__(self):
        clouds, labels=get_train_data()
        self.x_data=clouds
        self.y_data=labels
        self.lenth=clouds.size(0)
    def __getitem__(self, index):
        return self.x_data[index],self.y_data[index]
    def __len__(self):
        return self.lenth

第一个函数是构造函数,也可以理解为是初始化函数,在这里一般完成数据加载赋值给self下的变量(也就是实例化之后才能引用的变量,区别于静态变量)。其中的x_data,y_data,length这些变量名字不是固定的,可以按照喜好命名,但也要符合规范。

第二个函数是根据索引获取数据的方法,在使用迭代器不断地获取变量的时候,就会用到这个方法。其中的return函数后面的返回值,可以自定义返回值的数量,可以写成        return index, self.x_data[index],self.y_data[index]

第三个函数是获取数据的长度。

接下来是实例化这个对象,实例化后的Dataset用来作为构造Dataloader的参数:

point_data_set=PointDataSet()
data_loader=DataLoader(dataset=point_data_set,batch_size=32,shuffle=True)

猜你喜欢

转载自blog.csdn.net/york1996/article/details/84141034