摘要
本发明公开了生物信息学领域中预测非模式生物必需基因的数据处理装置及方法与应用。本发明所要解决的技术问题是如何筛选非模式生物的必需基因。本发明将目标物种的蛋白质序列和n种模式生物物种的蛋白质序列分别基于注释得到每种蛋白对应的标签;然后将蛋白质序列和标签嵌入蛋白质语言模型,输出嵌入向量;基于该嵌入向量为每一个蛋白质构建残基接触图;将残基接触图中每个氨基酸残基的特征使用图神经网络进行建模整合输出得到整体的蛋白质嵌入向量;将所有蛋白质嵌入向量输入分类器模型进行训练并使用激活函数输出蛋白质基因的必需概率值;基于分类器模型获得蛋白质所基因的必需概率值P1。本发明可应用于农业病害防控和生物农药开发。