一种多模态数据集的构建方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态数据集的构建方法及系统
申请号:CN202511215793
申请日期:2025-08-28
公开号:CN120723918A
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开了一种多模态数据集的构建方法及系统,所述多模态数据集包括结构化数据和非结构化数据,该方法包括:对非结构化数据进行离线处理及融合,生成结构化知识图谱;对结构化数据进行离线映射处理,将离线处理后的非结构化数据和离线映射处理后的结构化数据同时输入到预设的结构化模型中,生成数据库;结合结构化知识图谱和数据库,构建离线模型并训练,以得到目标大语言模型;在线获取并分析用户需求,制订分析计划,利用目标大语言模型执行分析计划,生成多模态数据集并向用户输出。该方法支持多模态数据融合分析,具备大规模实时数据处理能力,能高效应对动态数据的处理与更新需求。
技术关键词
大语言模型 离线 光学字符识别技术 分析用户需求 文本 图谱 生成数据库 深度学习算法 在线分析用户 机器学习算法 计划 构建系统 多模态数据融合 实时数据处理 表格 跨模态 图片