摘要
本发明提供一种基于跨模态预训练的小分子生成方法、装置及电子设备,其中的方法包括:获取给定的蛋白质口袋;获取蛋白质口袋的目标表示向量;基于预先训练的分子生成模型,根据目标表示向量,生成蛋白质口袋对应的配体小分子;其中,分子生成模型根据类药小分子样本及其对应的表示向量样本构成的训练样本集进行训练优化得到,表示向量样本通过分子编码器编码并减小模态间隙得到,用于模拟类药小分子样本对应蛋白质口袋样本的表示向量,分子编码器为预训练的对比学习模型。该方法通过预训练的对比学习模型将蛋白质口袋与配体小分子在表示空间中对齐,使用单模态的类药小分子数据无监督学习跨模态的蛋白质‑小分子配对任务,能够准确捕捉到药物分子的化学结构与构象的分布,摆脱对实验数据的依赖,生成了具有更合理几何结构和更接近真实药物分子结构分布的药物小分子,并提高了所生成药物小分子的可合成性、与靶点之间的亲和力。