摘要
本发明公开了一种基于语义检索的数学题数据增强方法及系统。所述方法包括:加载数学题数据集,利用预设神经网络模型编码器计算每一条数学题的特征,输出原始特征集合;对集合中的一个特征,通过计算语义相似性在整个特征集合中筛选出与其特征最相近的另一个特征,得到筛选后的特征;将原始特征与筛选后的特征进行混合增强,得到增强后的特征;将原始特征与增强后的特征输入预设神经网络模型解码器,得到结构化解决方案;重复以上过程,利用带有梯度停止策略的损失函数迭代训练模型的参数,得到优化后数学题及其解决方案。本发明能有效提高了模型对不同题型的适应能力,还能够跨越语言障碍,同样适用于中文和英文的数学题。