一种影像信息抽取方法、装置、计算机设备及存储介质

申请号：CN202510896997

申请日期：2025-06-30

公开号：CN120876877A

公开日期：2025-10-31

类型：发明专利

摘要

本申请属于人工智能技术领域，涉及一种影像信息抽取方法，包括构建一个影像信息抽取的多模态大模型，多模态大模型包括视觉编码器、特征转换器和解码器，首先冻住解码器，使用预训练影像数据集训练视觉编码器，提升视觉编码器视觉特征提取能力，随后冻住视觉编码器，构造伪影像数据集提升解码器的实体抽取能力，然后通过图像数据增强方法构造增强数据集，对候选模型进行微调，最终获得了高性能的影像信息抽取模型。本申请还提供一种影像信息抽取装置、计算机设备及存储介质。本申请可应用于金融科技业务管理程序系统中，提升了模型对影像信息提取的准确率，进而提升核保效率。

技术关键词

信息抽取方法影像文本识别信息抽取模型图像视觉特征图像嵌入计算机可读指令视觉特征提取多模态解码器实体词典转换器多层注意力数据计算机设备抽取装置疾病