基于深度学习的多模态蛋白质序列生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于深度学习的多模态蛋白质序列生成方法
申请号:CN202411964342
申请日期:2024-12-30
公开号:CN119943134A
公开日期:2025-05-06
类型:发明专利
摘要
一种基于深度学习的多模态蛋白质序列生成方法,通过融合蛋白质序列、文本描述的多模态信息,构建得到初始数据集,用于训练基于多模态交互注意力机制的蛋白质序列生成模型;在在线阶段根据实时输入的文本描述和对应的序列数据,通过训练后的模型以自回归生成方法生成符合预期功能和结构的蛋白质序列。本发明通过整合蛋白质序列与文本描述等多模态信息作为输入,采用基于多模态交互注意力机制的蛋白质生成模型,能够有效融合蛋白质序列和文本数据,从而生成高质量的蛋白质序列,本发明在生成远缘同源蛋白质和处理复杂任务中表现出显著优势,并通过实验验证了其在蛋白质质量和结构相似性上的提升。
技术关键词
序列生成方法 多模态交互 注意力机制 文本 位置编码单元 融合蛋白质 序列生成系统 解码器单元 数据处理单元 残差信息 策略 编码器 家族