摘要
本申请属于代谢组学大模型构建技术领域,涉及多维数据库融合的代谢组学大模型构建方法,为代谢物分配全局唯一ID,并将多源异构数据统一编码为多模态特征矩阵,避免了传统方法中因数据异构性导致的信息丢失;采用动态图生成器,结合多模态特征矩阵和先验通路邻接矩阵,通过相似度与可学习参数生成动态边权重构建代谢关系图,并利用多模态图注意力机制为不同模态特征分配自适应权重,执行图卷积消息传递,生成融合多模态信息的节点嵌入矩阵和优化后的动态代谢关系图;此外,通过元学习方法,将各数据库拆分为元任务,内循环利用动态图训练任务专属分类器,外循环通过查询集损失联合优化动态图生成器与元模型参数,显著提升了模型的跨库泛化能力。