Cora数据集是在GNN领域是非常经典的数据集,它是一个根据科学论文之间相互引用关系而构建的Graph数据集合,论文分为 7类,共2708篇
。
- Genetic_Algorithms
- Neural_Networks
- Probabilistic_Methods
- Reinforcement_Learning
- Rule_Learning
- Theory
这个数据集是一个用于图节点分类的任务,数据集中只有 一张图
,这张图中含有 2708个节点
, 10556条边
,每个节点的 特征维度为1433
。
PyG没有提供可视化的工具,所以我们需要将PyG的图数据 torch_geometric.data.data.Data
格式转换为 networkx.classes.graph.Graph
格式,然后利用 NetworkX
的工具进行可视化。
对Cora数据集进行可视化需要使用到 NetworkX
这个工具包,如果没有安装的需要提前安装一下,命令如下:
pip install networkx
对于可视化,有两种方式,分别如下:
方式一