基于拼写检查的中文文本纠正方法、装置以及计算机设备
申请号:CN202411643354
申请日期:2024-11-18
公开号:CN119886116B
公开日期:2025-10-28
类型:发明专利
摘要
本发明涉及中文文本纠正技术领域,特别涉及一种基于拼写检查的中文文本纠正方法、装置、计算机设备以及存储介质,通过从特定领域的文档文本中提取出领域特征信息,构建特定领域检索文本,以及从特定领域的案例池中提取出相关纠正案例,构建特定领域案例模板,结合待纠正中文文本以及特定领域检索文本、特定领域案例模板,作为输入数据传递给预训练模型,通过引入外部的领域知识以及相关纠正案例作为演示,指导语言模型进行准确文本纠正,防止语言模型生成过多与文本纠正结果无关的信息,提高语言模型对特定领域字符出现错误情况的识别和纠正的准确性。
技术关键词
中文文本
字符
纠正方法
拼音
视觉
形态
多模态
图像特征编码方法
模板
序列
计算机设备
语义信息提取
纠正技术
纠正装置
特征提取模块
处理器
数据
指令