基于多模态融合的OWS蓝牙耳机同声传译方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态融合的OWS蓝牙耳机同声传译方法及系统
申请号:CN202511027306
申请日期:2025-07-24
公开号:CN120954413A
公开日期:2025-11-14
类型:发明专利
摘要
本发明的基于多模态融合的OWS蓝牙耳机同声传译方法及系统,涉及胸外科手术智能同声传译与规划技术领域,方法包括:S1:基于环境音频信号与姿态检测信号形成多模态激活指令;S2:响应于多模态激活指令启动视觉传感器,形成增强语音特征信号;S3:将增强语音特征信号输入语音识别引擎生成源语言文本信号,并根据姿态检测信号中的用户注视方向特征生成上下文语义信号;S4:融合说话人标识信号与上下文语义信号对源语言文本信号进行动态修正,生成目标语言音频信号;S5:将目标语言音频信号转换为指向性声波信号输出。本发明的基于多模态融合的OWS蓝牙耳机同声传译方法及系统可以解决开放式耳机在噪声环境下同声传译准确性低、隐私性差的问题。
技术关键词
同声传译方法 信号 多模态 蓝牙耳机 语音特征 语音识别引擎 视觉传感器 说话人身份识别 音频 声场参数 麦克风阵列采集 语义 频谱特征 翻译规则 文本 翻译模型 空间耦合关系 同声传译系统
系统为您推荐了相关专利信息
实时检测系统 多模态数据融合 实时检测方法 传感器特征 异常事件
近距离传感器 声波 换能器 接收端 信号
旋翼无人机 误差系统 安全控制方法 干扰观测器 避障算法
NFC天线模块 接口模块 UART接口 设备内部电路 NFC控制器
机场场面 航空器 视觉特征 文本 多模态信息融合