PYG教程【三】对Cora数据集进行半监督节点分类

Cora数据集

PyG包含有大量的基准数据集。初始化数据集非常简单,数据集初始化会自动下载原始数据文件,并且会将它们处理成Data格式。

如下图所示,Cora数据集中只有一个图,该图包含2708个节点,10556条边,节点类别数为7,特征维度为1433。并且默认已经对数据集进行了划分,分为了训练集、验证集和测试集。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
然后看看节点特征和标签。x为节点特征矩阵,维度为2708*1433。y为节点标签向量,维度为2708,类别为7。
在这里插入图片描述

用GCN进行半监督节点分类

接下来就可以构建一个简单的GCN模型,在Cora数据集上进行半监督节点分类。

下面的GCN模型包含两个图卷积层。第一层输入维度为1433(节点特征维度),输出为16(与第一层输出一致),后面接上一个relu激活函数,以及dropout操作。第二层输入维度为16,输出为7(节点标签数量),后接log_softmax函数进行分类。

在这里插入图片描述

模型构建完成后,指定训练设备为GPU(没有的话就用CPU),注意这里默认使用的是0号cuda。如果cuda:0被占用了的话会报错,需要指定其他号码的cuda才能运行。然后,分别将GCN模型以及Cora图数据送入指定的设备。

优化器选择Adam,学习率设置为0.01,权重衰减设置为5e-4。这些都配置好以后就可以训练模型了,epoch设为200,每个epoch后清除上次的梯度信息,然后用nll_loss计算出训练集上的损失,调用backward函数计算出梯度后传回给Adam优化器进行参数更新。
在这里插入图片描述
最后在测试集上评估模型,计算分类正确率accuracy并显示。

在这里插入图片描述
至此,就完成了Cora数据集上的节点分类任务了。

おすすめ

転載: blog.csdn.net/vincent_duan/article/details/121394049