摘要
本发明涉及人工智能与数据挖掘交叉技术领域,具体提供了一种结构化信息智能采集与处理方法及装置,首先,进行名词定义,包括动态键值的生成、冲突消解引擎、多模态适配器和构建私有大语言模型;分析处理过程,在输入层通过多模态适配器对图像、音视频信息进行识别,提取其中的文字信息,形成原始文本;在处理层利用私有大语言模型引擎,对输入层的原始文本进行结构化提取,再按照设定的规则格式进行转换输出;在优化层,利用私有大模型实现质量校验,包括去重、冲突消解、智能摘要、数据落地和存储字段。与现有技术相比,本发明能够大大提升基础数据采集的效率。