基于多模态融合的OWS蓝牙耳机同声传译方法及系统

申请号：CN202511027306

申请日期：2025-07-24

公开号：CN120954413A

公开日期：2025-11-14

类型：发明专利

摘要

本发明的基于多模态融合的OWS蓝牙耳机同声传译方法及系统，涉及胸外科手术智能同声传译与规划技术领域,方法包括：S1：基于环境音频信号与姿态检测信号形成多模态激活指令；S2:响应于多模态激活指令启动视觉传感器，形成增强语音特征信号；S3：将增强语音特征信号输入语音识别引擎生成源语言文本信号，并根据姿态检测信号中的用户注视方向特征生成上下文语义信号；S4:融合说话人标识信号与上下文语义信号对源语言文本信号进行动态修正，生成目标语言音频信号；S5：将目标语言音频信号转换为指向性声波信号输出。本发明的基于多模态融合的OWS蓝牙耳机同声传译方法及系统可以解决开放式耳机在噪声环境下同声传译准确性低、隐私性差的问题。

技术关键词

同声传译方法信号多模态蓝牙耳机语音特征语音识别引擎视觉传感器说话人身份识别音频声场参数麦克风阵列采集语义频谱特征翻译规则文本翻译模型空间耦合关系同声传译系统

系统为您推荐了相关专利信息

一种多模态城市安防视频异常行为实时检测系统及方法

实时检测系统多模态数据融合实时检测方法传感器特征异常事件

近距离检测方法、近距离传感器和机械臂

近距离传感器声波换能器接收端信号

一种基于避障策略的旋翼无人机抗干扰安全控制方法

旋翼无人机误差系统安全控制方法干扰观测器避障算法

一种基于NFC FTM功能的透传模组及方法

NFC天线模块接口模块 UART接口设备内部电路 NFC控制器

一种多模态信息融合的机场场面机载态势增强方法

机场场面航空器视觉特征文本多模态信息融合