基于大语言模型感知的异构学术网络作者分类方法与系统
申请号:CN202510562090
申请日期:2025-04-30
公开号:CN120470401A
公开日期:2025-08-12
类型:发明专利
摘要
基于大语言模型感知的异构学术网络作者分类方法与系统,其方法包括:首先对异构学术网络数据进行处理,构建异构图,其中包括节点的文本属性和图结构信息。利用大语言模型生成节点和关系的语义嵌入,并通过Transformer整合多跳范围内的节点与关系信息,得到深层次节点嵌入向量。随后,在预训练阶段设计对比学习损失函数,优化嵌入表示质量以捕获节点间的复杂语义关系,并将深层次节点嵌入输入分类模型进行作者节点类别预测。采用交叉熵分类损失函数优化模型参数,最终完成学术网络中作者节点的分类任务,提升分类精度。本发明可应用于科研资源管理、学术搜索优化及相关领域数据分析。
技术关键词
节点
大语言模型
论文
关键词
异构
分类方法
语义
网络
生成关系
注意力机制
样本
邻居
预训练模型
文本
损失函数优化
定义
编码器
多层感知机
分类系统