ENZYMES数据集是在GNN领域是非常经典的数据集,它是一个根据生物分子蛋白质结构而构建的Graph数据集合,总共600个图,也就是对应600个样本(蛋白质分子) ,共有六种结构
这个数据集是一个用于图级分类任务的数据,该数据集中共有 600张图
,含有 19580个节点
, 174564条边
,每个节点的 特征维度为3
。
PyG没有提供可视化的工具,所以我们需要将PyG的图数据 torch_geometric.data.data.Data
格式转换为 networkx.classes.graph.Graph
格式,然后利用 NetworkX
的工具进行可视化。
对ENZYMES数据集进行可视化需要使用到 NetworkX
这个工具包,如果没有安装的需要提前安装一下,命令如下:
pip install networkx
ENZYMES共有600张图,为了测试代码,我们将可视化第一张图,代码如下:
import networkx as nx