一种基于图像检测自然语言描述目标的方法及电子设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于图像检测自然语言描述目标的方法及电子设备
申请号:
CN202510469031
申请日期:
2025-04-15
公开号:
CN120032149B
公开日期:
2025-07-11
类型:
发明专利
摘要
本申请公开了一种基于图像检测自然语言描述目标的方法,包括:将待检测图像输入至已训练的用于将输入图像转换为具有图像详细描述数据并对图像详细描述数据中的文本实例进行定位描述的详细定位描述数据的专家模型,通过专家模型的推理,得到详细定位描述数据,详细定位描述数据包括:图像详细描述数据、以及与图像详细描述数据中的文本实例相对应的图像实例描述数据,利用待检测图像的详细定位描述数据,获取待检测图像中与文本实例所表征的自然语言描述目标相匹配的候选目标。本申请有利于提高自然语言所描述目标检测的准确性。
技术关键词
数据
图像
多模态
自然语言
样本
文本
大语言模型
代表
标签
电子设备
存储器
感兴趣
处理器