摘要
本发明提供一种基于寡核苷酸探针序列多特征的模型,属于分子生物学技术领域;包括以下步骤:S1、探针设计:在DNA微阵列芯片上排列有25nt长度的寡核苷酸探针;S2、特征提取:针对每个寡核苷酸探针序列,提取多个特征参数,特征参数包括GC含量、二级结构倾向、热力学稳定性、序列复杂性、碱基堆积能,共计五个特征;S3、模型构建:基于所提取的五个特征,利用机器学习算法构建预测模型;S4、信号预测:将模型应用于新的寡核苷酸探针序列,预测其在杂交过程中产生的荧光信号强度。本发明通过用寡核苷酸探针的5个特征,共同用于模型的构建,实现了DNA微阵列芯片探针设计的闭环优化,提高探针设计的效率,降低测试生产成本。