摘要
一种基于生成模型的mRNA序列优化方法,在离线阶段利用随机生成或天然mRNA的数据库对构建得到的生成式模型进行训练;在在线阶段将待优化mRNA序列输入训练后的生成式模型,通过贪心或者概率随机采样方法为密码子序列概率分布和基于待优化mRNA序列每个位置的密码子的适应度的密码子概率分布生成对应权重,得到优化后mRNA序列。本发明通过生成式模型优化mRNA编码区密码子,并借助概率的加权求和来实现多指标的联合优化,显著提高了优化效率的同时,概率加权的框架给算法带来了更好的可拓展性和灵活性,为mRNA设计提供了一个功能更强大的优化工具。