图表解析方法、装置、电子设备及存储介质

申请号：CN202511243766

申请日期：2025-09-02

公开号：CN120745603B

公开日期：2025-12-09

类型：发明专利

摘要

本发明提供一种图表解析方法、装置、电子设备及存储介质，属于人工智能技术领域，包括：提取待解析的图表图像的视觉特征；将视觉特征输入至多模态大语言模型，以获取由多模态大语言模型输出的对图表图像的结构化解析结果。本发明通过在多模态大语言模型中设置一个由多个第一专家模块以及第一门控网络组成的第一任务适配模块，利用第一门控网络将图表解析任务动态分配给不同的第一专家模块协同处理，从而提升图表解析的全面性与准确性，且由于本发明基于低秩适配技术构建第一专家模块，训练时仅需更新少量参数，从而能够在提高图表解析能力的同时，有效保留多模态大语言模型在预训练阶段学习到的通用世界知识，避免了世界知识遗忘的问题。

技术关键词

大语言模型解析方法图表视觉特征模块多模态图像非暂态计算机可读存储介质网络文本特征提取单元电子设备处理器人工智能技术解析装置计算机程序产品参数样本标签存储器