PyG ENZYMES蛋白质分子图数据集可视化教程

ENZYMES数据集是在GNN领域是非常经典的数据集,它是一个根据生物分子蛋白质结构而构建的Graph数据集合,总共600个图,也就是对应600个样本(蛋白质分子) ,共有六种结构

这个数据集是一个用于图级分类任务的数据,该数据集中共有 600张图,含有 19580个节点174564条边,每个节点的 特征维度为3

PyG没有提供可视化的工具,所以我们需要将PyG的图数据 torch_geometric.data.data.Data 格式转换为 networkx.classes.graph.Graph 格式,然后利用 NetworkX 的工具进行可视化。

对ENZYMES数据集进行可视化需要使用到 NetworkX 这个工具包,如果没有安装的需要提前安装一下,命令如下:

pip install networkx

ENZYMES共有600张图,为了测试代码,我们将可视化第一张图,代码如下:

在这里插入图片描述

import networkx as nx

猜你喜欢

转载自blog.csdn.net/m0_47256162/article/details/128750384
今日推荐