摘要
本发明属于文本纠错技术领域,提供一种基于联邦学习的文本纠错方法和系统。该方法包括:构建与各参与方相对应的语料库,形成相对应的训练集;对预训练模型进行微调,以获取微调后的初始模型参数,得到初始文本纠错模型;对微调后的初始模型参数进行加密得到加密后的初始模型参数;计算各参与方的语料库或场景任务的相似性,筛选待聚合处理的模型参数,进行安全聚合,得到相应的聚合模型参数;对聚合模型参数进行解密,进一步更新初始文本纠错模型;进行多轮联邦学习,得到最优文本纠错模型,以对待纠错文本进行纠错。本发明采用联邦学习方法让不同参与方在不共享原始数据的情况下,充分利用各方的专业语料,得到更精确的文本纠错模型。