PyG创建自定义Graph图数据集

PyG内置了很多常用的数据集,例如 CoraENZYMES等图经典任务数据集,如果还需要其它论文中的数据集,可以参考该网站 TuDataset ,里面包含了很多图任务的数据集,可以根据自己任务需求去下载。

但是很多时候这些数据并不适合我们,我们需要将自己的数据集封装到PyG的Data类中,这时就需要自定义PyG的数据类,对于PyG中的数据实例类为 torch_geometric.data.Data

在这个类中有一些常用图数据属性,如下:

  • data.x:节点的特征矩阵,形状为【num_nodes,num_node_features】
  • data.edge_index:图的边,形状为【2,num_edges】
  • data.edge_attr:边的特征矩阵,形状为【num_edges,num_edge_features】
  • data.y:图对应的标签,根据任务不同维度也不同,对于节点任务,形状为【num_nodes,*】,如果是图级任务,那么形状就为【1,*】
  • data.pos:节点的位置矩阵,常用来可视化,形状为【num_nodes,num_dimensions】

如果我们创建自己的图数据集,就需要根据自己的数据集创建出上述图的属性,但这些属性并不是必须的,根据自己任务可选

假设我们的图如下,我们使用如下代码创建该图

猜你喜欢

转载自blog.csdn.net/m0_47256162/article/details/128749636