摘要
本发明涉及语音处理技术领域,具体涉及基于语音识别的智能会议内容实时翻译方法,包括以下步骤:采集原始语音信号,采用突变噪声抑制算法生成增强语音流,同步提取声纹指纹图谱;将增强语音流输入层级化分离网络,基于声纹指纹图谱进行多发言人语音解耦,输出带身份标签的语音片段并触发增量式术语知识库更新;生成跨语种语义一致性向量,同时构建动态更新的上下文记忆池;将语义一致性向量转换为目标语言流。本发明,提升语音解耦的空间准确性与语义独立性,为后续语义建模与翻译提供结构化输入基础,特别适用于交叉发言、重叠语流频发的会议场景。