一种结构化信息智能采集与处理方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种结构化信息智能采集与处理方法及装置
申请号:CN202511094241
申请日期:2025-08-06
公开号:CN121009898A
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及人工智能与数据挖掘交叉技术领域,具体提供了一种结构化信息智能采集与处理方法及装置,首先,进行名词定义,包括动态键值的生成、冲突消解引擎、多模态适配器和构建私有大语言模型;分析处理过程,在输入层通过多模态适配器对图像、音视频信息进行识别,提取其中的文字信息,形成原始文本;在处理层利用私有大语言模型引擎,对输入层的原始文本进行结构化提取,再按照设定的规则格式进行转换输出;在优化层,利用私有大模型实现质量校验,包括去重、冲突消解、智能摘要、数据落地和存储字段。与现有技术相比,本发明能够大大提升基础数据采集的效率。
技术关键词
大语言模型 机器可读程序 数据挖掘交叉技术 文本 适配器 多模态 键值 摘要 格式 动态 音视频 嵌套结构 字段 语义 图像 语音 存储器 处理器 拼音