一种基于多模态Agent的图像分类数据构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态Agent的图像分类数据构建方法
申请号:CN202510082819
申请日期:2025-01-20
公开号:CN119992195A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于多模态Agent的图像分类数据构建方法,包括以下步骤:输入图像、数据集信息:包括:1)从多种渠道收集的图像数据、照片及视频格式,连同预期的图像分类数据集的详细信息;2)直接输入数据集名称;Agent将执行在线搜索并整合预训练的模型数据以检索相关的数据集信息;用户根据提示输入其需求后,Agent开始与大模型互动,使模型能够利用提供的操作制定满足用户需求的计划,并将根据制定的计划自动调用操作,完成指定任务。本发明实现了图像分类数据集扩展和创建的全自动化和批量处理,显著减少了人力消耗,降低了数据集扩充与创建成本。与传统方法相比提高了操作效率,同时保持了高度的准确性。
技术关键词
数据构建方法 图像 多模态 分辨率 计划 大语言模型 数据分布 文本 格式 渠道 照片 指令 在线 视频 记忆 批量 变量 标签 样本
系统为您推荐了相关专利信息
膨胀算法 图片 深度估计算法 边缘提取算法 矩阵
Canny算法 生成方法 生成装置 矩阵 视角
长短记忆神经网络 数字孪生模型 智慧水利 智能推理 知识图谱库
普查系统 理论 图像处理方法 生态系统 时效性