摘要
本发明提供一种基于多模态特征提取的公文关键摘要生成方法及系统,涉及多模态人工智能生成技术领域,首先获取待处理公文的文本模态数据、图像模态数据和表格模态数据,接着对文本模态数据进行分层语义解析处理,生成文本语义特征集合,对图像模态数据进行视觉要素提取处理,生成图像特征集合,对表格模态数据进行结构化解析处理,生成表格特征集合,之后对文本语义特征集合、图像特征集合和表格特征集合进行跨模态对齐处理,确定文本语义、图像要素与表格要素之间的动态关联特征集合,并据此对上述三种特征集合进行多模态融合处理,生成待处理公文的目标摘要内容,由此充分利用了公文中多模态信息的互补性,生成的摘要更加完整、准确、有针对性。