基于语音识别的智能会议内容实时翻译方法

申请号：CN202510646085

申请日期：2025-05-20

公开号：CN120164479B

公开日期：2025-07-22

类型：发明专利

摘要

本发明涉及语音处理技术领域，具体涉及基于语音识别的智能会议内容实时翻译方法，包括以下步骤：采集原始语音信号，采用突变噪声抑制算法生成增强语音流，同步提取声纹指纹图谱；将增强语音流输入层级化分离网络，基于声纹指纹图谱进行多发言人语音解耦，输出带身份标签的语音片段并触发增量式术语知识库更新；生成跨语种语义一致性向量，同时构建动态更新的上下文记忆池；将语义一致性向量转换为目标语言流。本发明，提升语音解耦的空间准确性与语义独立性，为后续语义建模与翻译提供结构化输入基础，特别适用于交叉发言、重叠语流频发的会议场景。

技术关键词

翻译方法语音语义发言人术语噪声抑制算法会议图谱指纹掩码矩阵分布式麦克风阵列身份记忆分层存储架构一维卷积神经网络融合时空特征标签动态更新节点间信息