摘要
本发明公开了一种基于多模态大模型的异构数据转换方法及系统,旨在解决传统异构数据处理中存在的单模态局限、高迁移成本等问题。方法首先对图像、文本、音视频等多源异构数据进行格式适配与分类型预处理。接着通过ViT、BERT及Transformer交叉注意力机制,实现视觉、文本、音频特征的深度解析与跨模态语义关联,建立“视觉‑文本‑音频”语义映射。再基于动态提示工程,引导多模态大模型按预设Schema零样本生成结构化数据。随后通过Drools规则引擎纠错与格式归一化,保障数据符合业务标准。最后支持JSON/XML/数据库表等多格式输出,同时关联原始数据存储,实现数据溯源。本发明突破单模态处理局限,实现跨模态数据深度关联。