基于多模态大模型的知识结构化抽取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态大模型的知识结构化抽取方法
申请号:CN202511564132
申请日期:2025-10-30
公开号:CN121031762A
公开日期:2025-11-28
类型:发明专利
摘要
本申请提供一种基于多模态大模型的知识结构化抽取方法,涉及数据处理技术领域。包括:根据数据抽取需求,确定待抽取属性信息,并根据待抽取属性信息,生成结构化数据模型;根据结构化数据模型,按照预设的抽取策略,对待处理的原始多模态文件进行数据抽取,得到多个抽取结果;对多个抽取结果进行合并处理,得到合并抽取结果;对合并抽取结果进行校验,得到目标抽取结果。本方法在通过多模态大模型进行知识抽取中,通过多轮抽取结合分阶段抽取的抽取策略,可以降低模型一次抽取的数据量,避免数据抽取遗漏,同时分阶段抽取使得模型可以由粗到细,由全局理解到字段级精抽逐步递进,避免上下文丢失,提升抽取结果的精度。
技术关键词
结构化数据模型 多模态 切块 数据格式 分阶段 策略 数据处理技术 场景 表头 表格 字段 嵌套 精度 图像 关系