基于大模型的目标定位方法、装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型的目标定位方法、装置、电子设备及存储介质
申请号:CN202411578022
申请日期:2024-11-06
公开号:CN119469150B
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了基于大模型的目标定位方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及大模型、语音技术、计算机视觉、深度学习等领域。方案为:接收目标终端发送的定位请求,定位请求包括目标图片及语音指令;从语音指令中提取待定位物体的第一物体信息,根据第一物体信息,对目标图片进行目标检测,获取检测结果;根据候选物体在目标图片中的位置信息,从目标图片中截取候选物体的物体图片;根据物体图片、候选物体在目标图片中的位置信息及第一物体信息,利用大模型,从候选物体中确定目标物体;向终端发送目标物体在目标图片中的位置信息,以使目标终端根据目标物体在目标图片中的位置信息,确定目标物体相对目标终端的位置信息。
技术关键词
物体 图片 终端 文本 定位方法 图像 机器人 电子设备 模块 语音技术 计算机程序产品 机械臂 计算机视觉 处理器通信 指令 可读存储介质 解码