摘要
本发明公开了一种学习分子表征的自监督方法及系统,方法包括:S1、从PubChem中抽取分子的化学结构编码,生成预处理数据集;S2、基于transform er encoder构建用于预训练的初始深度学习模型InChINet;S3、将所述预处理数据集输入InChINet模型中对模型进行训练,得到预训练后的InChINet模型;S4、基于所述预训练后的InChINet模型得到待检测分子的分子表征。本发明的InChINet模型以低成本快速高效地输出高质量的分子表征,能够精准地预测分子性质、药物‑药物相互作用,可以应用于药物发现中的各个环节,加速了药物发现进程。