GNN论文周报｜来自南京大学、麻省理工、香港科技大学等机构前沿论文研究

图神经网络（GNN）是一类专门针对图结构数据的神经网络模型，在社交网络分析、知识图谱等领域中取得了不错的效果。近来，相关研究人员在GNN的可解释性、架构搜索、对比学习等方面做了很多探究。

本周精选了10篇GNN领域的优秀论文，来自南京大学、麻省理工、香港科技大学等机构。

为了方便大家阅读，只列出了论文标题、作者、ChatPaper综述等信息，如果感兴趣点击链接查看原文，PC端数据同步（收藏即可在PC端查看），每日新论文也可登录小程序查看。

1.Simple and Efficient Partial Graph Adversarial Attack:A New Perspective

这篇论文主要研究了图神经网络的鲁棒性和安全性，提出了一种全新的部分图对抗攻击方法（PGA）。现有的全局攻击方法将图中的所有节点作为攻击目标，虽然取得了不错的效果，但仍存在改进空间。关键问题是，当前的方法过于僵化地遵循全局攻击的定义，忽视了不同节点具有不同的鲁棒性，并不是同样容易受到攻击。从全局攻击者的角度来看，我们应该明智地分配攻击预算，而不是在高度鲁棒的节点上浪费。为此，论文提出了一种分层目标选择策略，使攻击者只需关注易于攻击的节点，然后提出了一种成本效益高的锚点选择策略和一种更激进的基于迭代的贪婪攻击方法，以实现更高效的攻击。大量的实验结果证明，与现有的全局攻击方法相比，PGA 在攻击效果和攻击效率方面都取得了显著的改进。

https://www.aminer.cn/pub/64dc49933fda6d7f06389f1e/

2.Conformal Predictions EnhancedExpert-guided Meshing withGraph Neural Networks

这篇论文主要研究了利用图神经网络（GNN）和专家指导来进行自适应网格生成的问题。在计算流体动力学（CFD）中，模拟域的精确网格划分对于准确模拟至关重要，但精细网格和自适应网格划分技术都存在较高的计算成本。因此，网格生成过程严重依赖于专家知识和多年经验。自动化网格生成可以节省大量时间和精力，加快设计过程。本文提出了一种基于机器学习的网格生成方案，使用 GNN 和专家指导自动为飞机模型生成 CFD 网格。文章中引入了一种新的 3D 分割算法，该算法在表面分类上优于两种最先进的模型，PointNet++和 PointMLP。同时，文章还提出了一种利用保形预测方法将 3D 网格预测投影到 CAD 表面的新方法，该方法提供边缘的统计保证和稳健的不确定性量化和处理。通过实际案例研究，文章证明了保形预测的有效性，即使对于弱模型和较低精度模型，也能有效避免网格划分不足导致的 CFD 模拟失败。最后，文章通过与自适应网格划分技术的比较，证明其方法在整体模拟过程中快 5 倍，并公开了项目代码和数据。

https://www.aminer.cn/pub/64dc49903fda6d7f06389b43/

3.Search to Fine-tune Pre-trained Graph Neural Networks for Graph-level Tasks

这篇论文主要研究了如何为预训练的图神经网络（GNN）寻找更好的微调策略，以提高其在图相关任务中的性能。尽管 GNN 在许多图相关任务中取得了前所未有的成功，但与其他神经网络一样，GNN 也面临着标签稀缺的问题。因此，最近的研究尝试通过在大规模无标签图上预训练 GNN，并将无标签图中的知识转移到目标下游任务中。这种适应通常通过用有限的标记数据对预训练的 GNN 进行微调来实现。尽管微调很重要，但当前的 GNN 预训练工作常常忽略设计一个好的微调策略，以便更好地利用转移的知识并提高下游任务的性能。只有少数研究开始研究预训练 GNN 的更好的微调策略。但他们的设计要么有很强的假设，要么忽视了不同下游数据集的数据感知问题。因此，我们旨在为预训练的 GNN 设计更好的微调策略，以提高模型在下游任务中的性能。我们提出了一种用于图级别任务的搜索微调预训练图神经网络（S2PGNN）的方法，该方法根据下游任务给出的标记数据自适应地设计合适的微调框架。为了确保搜索微调策略带来的改进，我们仔细总结了一个适合 GNN 的适当的搜索空间。实证研究表明，S2PGNN 可以实现在 10 个著名的预训练 GNN 之上，并一致地提高它们的性能。此外，S2PGNN 在 GNN 领域内外的现有微调策略中都取得了更好的性能。

https://www.aminer.cn/pub/64dafb293fda6d7f064e2d06/

4.Reinforcement Graph Clustering with Unknown Cluster Number

这篇论文主要研究了深度图聚类中的强化学习方法。现有的深度图聚类方法在无监督的情况下对节点进行分组，其性能的提高严重依赖于准确预先定义的簇数，这在现实世界场景中并不总是可用的。为了使深度图聚类算法在不依赖预先定义的簇数的情况下工作，作者提出了一种新的深度图聚类方法，即强化图聚类（RGC）。在该方法中，簇数确定和无监督表示学习通过强化学习机制统一到一个统一的框架中。具体来说，首先使用对比预训练任务学习判别节点表示；然后，为了在图中捕获准确的聚类状态，同时考虑节点和簇状态；接下来，在每个状态下，通过质量网络评估不同簇数的质量，并执行贪婪动作以确定簇数。为了进行反馈动作，提出了一种以聚类为导向的奖励函数，以增强同一簇的凝聚力和区分不同簇。广泛的实验证明了作者提出的方法的有效性和效率。

https://www.aminer.cn/pub/64dafb293fda6d7f064e2c80/

5.Learning on Graphs with Out-of-Distribution Nodes

这篇论文主要研究了在图神经网络（GNNs）中处理具有未知分布节点的问题。作者将这种节点定义为“out-of-distribution（OOD）节点”，即训练集中未见过标签的节点。由于许多网络是由程序自动构建的，现实世界中的图可能存在噪声，并可能包含来自未知分布的节点。作者定义了具有 OOD 节点的图学习问题，并旨在完成两个任务：1）检测不属于已知分布的节点；2）将剩余节点分类为已知类别之一。作者证明了图结构中的连接模式对于异常检测是有信息的，并提出了一种新的 GNN 模型——Out-of-Distribution Graph Attention Network（OODGAT），该模型显式地建模了不同类型的节点之间的交互，并在特征传播过程中将内插值与外插值分离。大量实验证明，OODGAT 在异常检测方面的表现远远优于现有方法，而在分布分类方面则更好或可比。

https://www.aminer.cn/pub/63034ef890e50fcafd747540/

6.Natural Language is All a Graph Needs

这篇论文的主要内容是利用大规模预训练语言模型（如 ChatGPT）来处理图结构数据。与图像、视频或文本等相对独立的数据不同，图结构数据包含丰富的结构和关系信息。语言模型在描述复杂结构方面表现出色。然而，现有的将图学习问题纳入生成语言建模框架的工作非常有限。随着语言模型的重要性不断增长，探索语言模型是否能够取代 GNN 成为图机器学习的基础模型变得越来越重要。在这篇论文中，作者提出了一种名为 InstructGLM 的方法，该方法基于自然语言指令系统地设计高度可扩展的提示，并使用自然语言描述图的几何结构和节点特征，以便通过指令调整语言模型在图上进行学习和推理。在 ogbn-arxiv、Cora 和 PubMed 数据集上，该方法优于所有竞争性的 GNN 基线，这表明了该方法的有效性，并为生成语言模型取代 GNN 成为图机器学习的基础模型提供了启示。

https://www.aminer.cn/pub/64dafb293fda6d7f064e2dbd/

7.SimMatchV2: Semi-SupervisedLearning with Graph Consistency

本文介绍了一种新的半监督学习算法 SimMatchV2，该算法从图论的角度在标注数据和未标注数据之间建立了各种一致性约束。在 SimMatchV2 中，将样本的扩充视图视为一个节点，包含标签和对应的表示。不同的节点通过边缘连接，边缘由节点表示的相似性测量。SimMatchV2 提出了四种一致性，分别是节点-- 节点一致性、节点-- 边缘一致性、边缘-- 边缘一致性和边缘-- 节点一致性。此外，还发现简单的特征归一化可以减少不同扩充视图之间的特征范数差距，显著提高 SimMatchV2 的性能。SimMatchV2 在多个半监督学习基准上进行了验证，取得了显著优于以前方法的成果，达到了当前最佳性能。

https://www.aminer.cn/pub/64dafb293fda6d7f064e2bf8/

8.Node Embedding for Homophilous Graphs with ARGEW: Augmentation of Random walks by Graph Edge Weights

这篇论文主要研究了在有向同质图中节点嵌入的问题。在有向同质图中，相似的节点之间连接的边权重较大。作者提出了一种名为 ARGEW（通过图边权重扩展随机漫步）的新方法，该方法通过扩展随机漫步，使得具有较大边权重的节点对最终具有更接近的嵌入。与其他基于随机游走的节点嵌入方法（如 node2vec 和 node2vec+）不同，ARGEW 可以更好地反映边权重。通过在几个实际网络中的实验，作者证明了 ARGEW 的效果优于不使用该方法的情况。此外，作者还在节点分类任务中评估了 ARGEW 的性能，结果表明，使用 ARGEW 的 node2vec 优于纯 node2vec，并且对超参数不敏感。事实上，即使在没有节点特征或标签信息的情况下，其效果与使用监督 GCN 的方法相当。最后，作者通过探究具有明确结构角色的合成图的共现分布，解释了 ARGEW 为何始终表现良好。

https://www.aminer.cn/pub/64d9a6813fda6d7f061d303a/

9.Homophily-enhanced Structure Learning for Graph Clustering

这篇论文主要研究了基于图神经网络（GNN）的图聚类问题。尽管现有的基于 GNN 的图聚类方法取得了显著的成果，但它们往往忽视了图结构的质量，这导致性能不佳。图结构学习可以改进输入图，通过添加缺失的链接和删除虚假连接。然而，以前的图结构学习主要集中在监督设置中，由于缺乏真实标签，因此不能直接应用于聚类任务。为了填补这一空白，作者提出了一种名为同质性增强结构学习的图聚类方法（HoLe）。作者的动机来源于观察到在图结构中微妙地增强同质性程度可以显著改善 GNNs 和聚类结果。为了实现这一目标，作者开发了两个面向聚类的结构学习模块，即层次相关性估计和聚类感知稀疏化。前者通过利用潜在和聚类空间的指导，更准确地估计节点之间的成对关系，后者根据相似矩阵和聚类分配生成稀疏结构。此外，作者还设计了一种联合优化方法，该方法在训练同质性增强的结构学习和基于 GNN 的聚类之间交替进行，从而强制它们的相互作用。在七个基准数据集上的大量实验表明，HoLe 在各种类型和规模的图聚类问题上优于最先进的基线方法。

https://www.aminer.cn/pub/64d5b2153fda6d7f060d005f/

10.DegUIL: Degree-aware Graph Neural Networks for Long-tailed User Identity Linkage

这篇论文主要研究了在跨网络数据挖掘中的用户身份链接问题，近期的研究通过利用图神经网络（GNNs）来捕捉网络结构取得了显著的成果。然而，这些研究很少分析影响 UIL 性能的实际节点层面的瓶颈。首先，图中节点的度数差异很大且呈现长尾分布，很大一部分度数较小的尾节点因为结构信息有限而代表性不足，严重影响了链接性能。另一个通常被忽视的瓶颈是超头节点，虽然通常认为头节点表现良好，但作者发现一些度数极高的超头节点由于现实世界社交图中朋友随机性的噪音，也难以对齐对应节点，影响了性能。为了学习这两组节点的理想表示，论文提出了一种度数感知模型 DegUIL 来缩小度数差距。模型分别通过预测和纠正邻居偏差，以及丢弃冗余结构信息，为尾节点和超头节点提供合适的邻居信息，以获得用于 GNN 聚合的理想邻居。广泛的实验证明了模型的优越性。

https://www.aminer.cn/pub/64d5b2153fda6d7f060d006c/

GNN论文周报｜来自南京大学、麻省理工、香港科技大学等机构前沿论文研究

猜你喜欢