ENZYMES图分类数据集介绍 - 代码天地

ENZYMES图分类数据集介绍

企业开发 2023-01-28 19:18:10 阅读次数: 0

ENZYMES数据集是在GNN领域是非常经典的数据集，它是一个根据生物分子蛋白质结构而构建的Graph数据集合，总共600个图，也就是对应600个样本（蛋白质分子），共有六种结构

这个数据集是一个用于图级分类任务的数据，该数据集中共有 600张图，含有 19580个节点， 174564条边，每个节点的 特征维度为3。

1、读取ENZYMES数据集

在PyG中的 TUDataset 这个包可以导入很多图数据集，如果是第一次导入，需要进行下载，如果是因为网络问题，可以先从其它网站下载到本地，然后再使用该函数进行读取

from torch_geometric.datasets import TUDataset
dataset = TUDataset(root='./data/ENZYMES/', name='ENZYMES')

2、获取数据

data = dataset.data

print(data)
>>>Data(x=[19580, 3], edge_index=[2, 74564], y=[600])

从该结果可以看出这个数据集的节点特征矩阵的维度为【19580，3】，代表这个数据集（600张图一共）有19580个节点，每个节点的特征维度为3，共有74564条边，这些数据并不是一个图的，而是ENZYMES600张图加起来一共的。

3、获取第一张图的属性
如果我们需要获取第一张图，可以通过索引的方式，代码如下：

graph1 = dataset[0]

print(graph1)
>>>Data(edge_index=[2, 168], x=[37, 3], y=[1])

该结果可以看出第一张图，也就是第一个样本共有37个节点，168条边，对应一个类别

5、获取ENZYMES常见属性信息

print(dataset.num_classes)
>>>6

print(dataset.num_edge_attributes)
>>>0

print(dataset.num_edge_features)
>>>0

print(dataset.num_edge_labels)
>>>0

print(dataset.num_features)
>>>3

print(dataset.num_node_attributes)
>>>18

print(dataset.num_node_features)
>>>3

print(dataset.num_node_labels)
>>>3

6、可视化ENZYMES图数据
在这里插入图片描述

# 可视化图结构
graph = nx.Graph() # 创建一个空图

edge_index = dataset[0].edge_index # 获取第一张图

source = edge_index[0] # 起点
target = edge_index[1] # 终点

for src, tge in zip(source, target):
    graph.add_edge(src.item(), tge.item())
    
plt.rcParams['figure.dpi'] = 300 # 设置分辨率
fig , ax1 = plt.subplots(figsize=(10,10))

nx.draw_networkx(G=graph , ax=ax1 , font_size=6 , node_size=150)
plt.show()

猜你喜欢

转载自blog.csdn.net/m0_47256162/article/details/128750192

ENZYMES图分类数据集介绍

PyG ENZYMES蛋白质分子图数据集可视化教程

图像，分类的数据集的介绍

视频分类数据集介绍

分类算法 - 数据集介绍与划分

视频分类之数据集介绍

图像分类和目标检测常用数据集介绍

[转] 文本分类——GLUE数据集介绍

KNN分类算法介绍，用KNN分类鸢尾花数据集（iris）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（三）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十二）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（二）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（一）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十三）

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（十四）

数据集——文物分类

【数据集介绍】Cora数据集介绍

第五节算法的分类介绍和数据集的划分

python之sklearn- 分类算法-2.1 数据集介绍与划分

深度学习（五）softmax 回归之：分类算法介绍，如何加载 Fashion-MINIST 数据集

分类数据集制备过程

notMNIST 数据集pyTorch分类

MNIST数据集分类的处理

Mnist数据集图像分类

EfficientNet 分类花数据集

图像分类与分割数据集

KNN 分类红酒数据集

ImageNet数据集介绍

Cityscapes数据集介绍

IRIS数据集介绍

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)