一种基于多模态大模型的通用图像标注系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态大模型的通用图像标注系统及方法
申请号:CN202411369403
申请日期:2024-09-29
公开号:CN118887496A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的通用图像标注系统,涉及图像数据标注和人工智能技术领域,包括用户交互模块、数据集模块、自动标注模块和后端模块。本发明还公开了一种基于多模态大模型的通用图像标注方法,包括S100、数据集准备;S200、多模态大模型构建;S300、多模态大模型训练;S400、多模态大模型部署;S500、基于多模态大模型的通用图像标注。本发明基于多模态大模型,标注精度高,大幅提高了标注效率,节省了人工成本,显著降低了标注过程中的人工参与的程度,解决了现有技术在非标准类别识别和描述上的难题,在兼顾图像目标检测精度的前提下,实现了目标类别和属性的泛化能力。
技术关键词
多模态 图像标注系统 图像标注方法 视觉特征 大语言模型 文本 检测器 数据 参数 指令 模块通信 自然语言 深度神经网络 人工智能技术 非标准 坐标 物体 阶段