基于用户指令强调的听障人士交流方法及系统

申请号：CN202510847138

申请日期：2025-06-24

公开号：CN120412103B

公开日期：2025-10-21

类型：发明专利

摘要

本发明提供一种基于用户指令强调的听障人士交流方法及系统，方法包括：获取待处理的手语视频和用户指令信息；利用基于Transformer架构的视觉模型对待处理的手语视频进行特征提取，获得手语动作特征矩阵；基于所述手语动作特征矩阵分别获取指令强调的手语动作特征向量和时空强调的手语动作特征矩阵；将所述指令强调的手语动作特征向量和时空强调的手语动作特征矩阵进行特征融合，获得融合后的手语动作特征矩阵；基于所述融合后的手语动作特征矩阵通过预设的语音合成模型，获得待处理的手语视频对应的语音信息。本发明达到了显著提高手语识别的准确率的技术效果。

技术关键词

动作特征手语矩阵指令情感类别情感特征语音视频交叉注意力机制蒸馏模糊特征多模态情感识别 sigmoid函数模糊集合损失函数优化多分支自然语言图像面部电子设备