摘要
本申请涉及长文本对比技术领域,公开了一种长文本对比方法、装置、设备及存储介质,包括:将获取的标板合同文件和待比对合同文件转换为结构化文本,并提取结构化文本的段落序列;基于动态规划算法对标板合同文件和待比对合同文件的段落序列进行分层段落对齐,确定对齐段落对;根据对齐段落对在标板合同文件和待比对合同文件中的未对齐段落中进行差异类型标记,得到第一差异结果;通过预设对比算法对对齐段落对进行字符级最小编辑差异比对,得到第二差异结果;根据第一差异结果和/或第二差异结果确定待比对合同文件和标板合同文件之间的文本对比结果。通过分层段落的精细化比对,能够在不同层次上准确检测差异,确保对齐的全面性和精确性。