摘要
本申请公开了一种机器人手语交流方法及相关装置、存储介质,所述方法包括:采集当前用户的各帧手势图像并进行特征提取;将各帧手势图像的特征输入训练好的手势识别模型中,识别出当前手势识别结果;基于手势符号与词汇的映射关系,对当前手势识别结果进行映射,得到词汇序列;将词汇序列按照预设语法规则组成当前完整识别文本;通过多模态大语言模型结合当前完整识别文本、当前场景理解信息以及当前动作理解信息,对当前完整识别文本进行修正;将修正后的当前完整识别文本、当前场景图片以及历史交流信息输入第三视觉语言模型中,分析出当前响应文本;将当前响应文本转换为当前手语序列;根据当前手语语序驱动机器人模拟手语动作。