长文本对比方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
长文本对比方法、装置、设备及存储介质
申请号:CN202510892644
申请日期:2025-06-30
公开号:CN120781820A
公开日期:2025-10-14
类型:发明专利
摘要
本申请涉及长文本对比技术领域,公开了一种长文本对比方法、装置、设备及存储介质,包括:将获取的标板合同文件和待比对合同文件转换为结构化文本,并提取结构化文本的段落序列;基于动态规划算法对标板合同文件和待比对合同文件的段落序列进行分层段落对齐,确定对齐段落对;根据对齐段落对在标板合同文件和待比对合同文件中的未对齐段落中进行差异类型标记,得到第一差异结果;通过预设对比算法对对齐段落对进行字符级最小编辑差异比对,得到第二差异结果;根据第一差异结果和/或第二差异结果确定待比对合同文件和标板合同文件之间的文本对比结果。通过分层段落的精细化比对,能够在不同层次上准确检测差异,确保对齐的全面性和精确性。
技术关键词
文本比对方法 动态规划算法 层级 字符 序列 编辑 补丁 规则集 策略 分层 标记 比对装置 分词 对齐模块 处理器 可读存储介质 报告
系统为您推荐了相关专利信息
混合神经网络模型 梯度提升树模型 编码 高斯混合模型 注意力
音频数据混合方法 音频特征参数 特征提取模型 注意力参数 分类器算法
通信基站 数据 电池组 评价方法 矩阵
蚂蚁 多智能体动态 机制 指标 序列
注意力机制 多尺度特征学习 补丁 数据 混合损失函数