摘要
本发明公开了一种基于自适应数据筛选的多模态化学反应产率预测方法,属于化学合成与机器学习交叉技术领域。本发明的方法通过构建包含一维化学属性数据、二维分子结构图谱及三维空间构型的多模态输入体系,实现分子相互作用的多维度解析;同时采用多阶段训练过程,模拟人类认知规律,使模型从基础反应特征向复杂反应机理逐层递进学习。本发明通过动态调整筛选阈值,有效抑制噪声干扰并提升对长尾分布数据的适应性。相比传统单模态预测模型,本发明提升了在含噪数据集上的预测准确率,显著降低化学合成实验的试错成本,为高效筛选反应条件及加速新化合物研发提供了可靠的技术支撑。