摘要
本发明公开了一种基于大模型句法偏好优化的语法纠错方法,本发明以协同利用检索示例句子对内和检索示例句子对间的句法关联性。一方面,利用蒙特卡洛树搜索算法探索检索示例间的句法结构差异对纠错性能的影响,并基于动态权重调节搜索路径选择,构建包含隐性句法关联的句法感知语料。另一方面,通过构建句法偏好对齐机制,有效利用句法感知语料中蕴含的句法知识,实现语法纠错模型参数的动态调整,进而提升其在复杂语法错误纠错任务中的性能。本发明在两个中文纠错数据集和两个英文纠错数据集上开展了全面的对比实验。实验结果表明,本发明能有效整合检索示例中的结构化句法特征,有效缓解语法纠错模型的过度纠正现象。