一种基于多模态视觉信息的人机交互式目标识别与定位系统及其载体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态视觉信息的人机交互式目标识别与定位系统及其载体
申请号:CN202510810926
申请日期:2025-06-17
公开号:CN120707824A
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及机器人感知与智能人机交互领域,设备平台与感知模块,系统安装有Intel RealSense D435i深度相机,用于实时采集包含深度信息的RGB‑D图像序列,同时,嵌入先进的YOLOv8‑Pose深度学习模型,实现对前方场景中人类上半身骨骼关键点的高精度检测、自然交互、手势指引机制、方向推断与目标候选聚合、交互式目标筛选与判定、稳健性增强策略、深度缺失与噪声鲁棒性、残缺目标补全机制,主要实现基于深度视觉、姿态估计和语义理解的人机协作式目标物体识别与定位方法。该技术可适用于服务机器人、智能助理机器人等对自主感知与自然交互有较高要求的实际应用场景,进一步促进了人机共融与智能环境的建设。
技术关键词
人体关键点检测 智能助理机器人 深度相机 深度图 空间三维位置 姿态估计 智能人机交互 坐标 相机标定参数 物体检测框 多模态 后续处理过程 彩色图像 场景 噪声鲁棒性 定位系统 骨骼关键点