摘要
本发明提供一种小分子活性优化方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,方法包括:获取待优化小分子的序列化结构表示和基于自然语言的活性优化指令;将所述序列化结构表示和所述活性优化指令拼接后,输入至预训练的多模态分子编辑模型中,通过两阶段解码输出优化后的优化小分子;其中,所述多模态分子编辑模型为:基于小分子活性优化数据集对多模态机器学习模型进行训练得到,所述多模态机器学习模型通过联合学习分子结构表示和自然语言指令建立跨模态关联。通过本发明提供的方法,采用自然语言对生物活性实验及活性判别准则进行建模,有效地提升了模型的泛化能力和易用性,有效克服了现有技术在生物活性优化场景中的局限性。