8个数据集全面胜出！思维链推理刷新图学习表现上限

7428点击 2025-06-08 15:17

图神经网络还能更聪明？思维链提示学习来了！

由于图数据拥有复杂的非线性结构和缺少文本信息，语言模型中的思维链（Chain-of-Thought，CoT）提示学习方法难以简单直接地应用于图数据。

基于此，来自新加坡管理大学和中国科学技术大学的研究者们提出了GCoT——首个应用于无文本图数据的类思维链提示学习框架。

实验结果表明，GCoT在八个图数据集上的少样本节点分类与图分类任务全面超越现有SOTA方法，尤其在1-5样本的极少样本设置下表现最为显著。

8个数据集全面胜出！思维链推理刷新图学习表现上限

GCoT方法解析

GCoT的核心思想是将下游的推断过程拆分为多个推断步骤。具体包含：

将图和提示一并输入到预训练图编码器中进行推断；

通过聚合各层隐藏表示来生成“思维”，以学习当前步骤每个节点的表示；

基于该思维学习节点专属提示，引导下一步的推断。

研究者们在八个公开数据集上进行了全面实验以评估和分析GCoT。

整体框架

8个数据集全面胜出！思维链推理刷新图学习表现上限

研究者们将思维链提示学习分为三个部分：

1.基于提示的推断

第步推断中，研究者将查询图及其使用提示作用后的特征矩阵输入预训练图编码器以得到各层嵌入表示。

2.思维构建

为有效利用多层结构信息，研究人员将每一层的嵌入表示做加权求和得到融合后的“思维”。

3.基于思维的提示学习Thought conditioned prompt learning

研究人员设计的“思维” 捕获了图中节点的结构知识并用于指导下一步推断。由于每个节点可能具有不同的特质，他们设计了一个条件网络（Condition Net），将上一轮思维作为输入，生成节点的专属性提示矩阵，并将其用于下一步输入特征调整。

标准提示学习

同时研究人员也采用了标准图提示学习方法来进一步对齐上下游任务。参考GPF+，他们训练得到了个偏置项提示并通过注意力机制融合提示向量。

与GPF+方法不同的是，他们将融合得到的提示作用于最终输出的嵌入表示而不是最初始的特征矩阵上。

提示的微调

针对下游任务研究人员设计了损失以便微调模型学习的提示：

8个数据集全面胜出！思维链推理刷新图学习表现上限

其中，是最终提示后的节点或图的嵌入，是类别的原型向量（所有标签样本嵌入的平均），是温度系数。

实验结果

研究者们在八个基准数据集上进行了全面的实验，评估他们所提出的GCoT在少样本节点分类和图分类任务上的有效性。

少样本学习表现

1-shot节点与整图分类

8个数据集全面胜出！思维链推理刷新图学习表现上限

通过上表研究者们得到以下结论：

GCoT在节点分类以及图分类任务中都超越了其他的基准，展现了其性能的优势和鲁棒性。
预训练方法通常优于有监督学习方法，因为前者组利用了预训练模型。这些结果突显了从无标签图中获得通用知识的重要性。
图提示学习模型（GPF/GPF+，ProG，GraphPrompt）通常优于基于微调的预训练方法，这源于这些模型通过提示缩小了预训练与下游任务的区别。但是这一些模型都是单步提示，因此表现劣于多步思考提示的GCoT模型。

k-shot节点与整图分类

8个数据集全面胜出！思维链推理刷新图学习表现上限

研究者们进一步进行了下游1-10样本数目的实验，具体结果呈现在上图中，他们发现GCoT几乎在所有少样本分类任务中都超越了其他基准，尤其是在1-5少样本数目中。

消融实验

为全面了解GCoT模型中各层的作用，研究者们进一步设计了两项消融实验：

逐层研究GCoT各个部分的单独作用
研究CoT作用于其它基准模型上的影响

8个数据集全面胜出！思维链推理刷新图学习表现上限

首先他们对GCoT的四种变体做了对比实验。毫无疑问，完整的GCoT依然是最优，去除了所有推断的GCoT\CoT结果凸显了分步推断机制的重要性，使用了单步推断的GCoT\L1，L2，L3则验证了多步推断融合各层级的信息的有效性。

8个数据集全面胜出！思维链推理刷新图学习表现上限

其次研究者们将CoT设计加入图提示学习的其它基准模型中(GPF，GPF+，ProG，GraphPrompt)，并再次研究这些模型的性能，结果呈现在上表中。

他们观察到对于所有的模型加入了CoT后效果都有提升，这进一步表明了他们设计的GCoT可以广泛适用于各种图提示学习模型，并在节点分类与图分类上有通用性。

总结

本文中研究者提出的GCoT是首次将思维链提示学习框架扩展到无文本图数据上的尝试，具体而言他们做了如下设计：

逐步推断机制

通过逐步推断将思维链提示学习引入图学习中，每步推断包含“基于提示的推断”、“思维构建”以及“基于思维的提示学习”过程。

融合生成思维提示

首先将经过提示修改的查询图输入预训练图编码器，随后通过融合编码器所有层的隐藏嵌入来构建思维向量，以捕获层次化结构知识。

节点特定提示

基于每步思维生成的提示向量，生成一系列节点特定提示来引导下一步推断。

他们在八个图数据集上进行了广泛实验，涵盖节点分类与图分类两类任务，结果表明GCoT在少样本学习中相较现有SOTA方法具有显著优势。

作为一种面向无文本图的尝试性框架，GCoT在一定程度上拓展了现有图学习方法的推理方式，也为后续相关研究提供了新的思路。

论文链接：https://arxiv.org/pdf/2502.08092

代码链接：https://github.com/Eric-Kuai/GCoT

文章来自于微信公众号“量子位”。

8个数据集全面胜出！思维链推理刷新图学习表现上限

关键词: AI , GCoT , 模型训练 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0