预测非模式生物必需基因的数据处理装置及方法与应用

申请号：CN202511438715

申请日期：2025-10-10

公开号：CN120895108A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了生物信息学领域中预测非模式生物必需基因的数据处理装置及方法与应用。本发明所要解决的技术问题是如何筛选非模式生物的必需基因。本发明将目标物种的蛋白质序列和n种模式生物物种的蛋白质序列分别基于注释得到每种蛋白对应的标签；然后将蛋白质序列和标签嵌入蛋白质语言模型，输出嵌入向量；基于该嵌入向量为每一个蛋白质构建残基接触图；将残基接触图中每个氨基酸残基的特征使用图神经网络进行建模整合输出得到整体的蛋白质嵌入向量；将所有蛋白质嵌入向量输入分类器模型进行训练并使用激活函数输出蛋白质基因的必需概率值；基于分类器模型获得蛋白质所基因的必需概率值P1。本发明可应用于农业病害防控和生物农药开发。

技术关键词

蛋白互作网络分类器模型数据处理装置生物物种基因生物农药开发神经网络模型 RNA干扰靶点农业病害组学特征计算机程序产品序列模式标签可读存储介质处理器注意力节点非线性