摘要
本发明提供一种基于合同OCR识别的合同重点信息提取方法和系统,涉及文件处理技术领域,所述方法包括:通过ORC识别系统获得合同页面的文本信息,并标注文本信息所属的合同页面和第一位置信息;通过图像识别模型对合同页面图像进行识别,确定章节标题的第一区域,段落的第二区域和签名或盖章位置的第三区域;根据第一位置信息、第一区域和第二区域,确定文本信息的文本类型及其所属的章节和段落;根据文本类型和语义识别模型,筛选重点章节标题;根据段落的文本信息和语义识别模型,确定重点文本内容。根据本发明,可筛选合同中重点内容,便于合同审核人员查看和审核,有效降低合同审核的难度,以及审核合同消耗的人力和成本。