一种多信道语音处理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多信道语音处理方法及系统
申请号:CN202510909250
申请日期:2025-07-01
公开号:CN120600031A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种多信道语音处理方法及系统,属于人工智能与语音信号处理领域。包括:获取多信道音频信号并构建SSL的单信道预训练模型;基于多信道音频信号,对SSL的单信道预训练模型进行结构优化,得到多信道声纹特征提取预训练模型;进行多阶段联合优化训练,结合AAM损失对多信道声纹特征提取预训练模型进行微调,生成多信道语音处理模型;当接收到待处理的多声道音频信号时,通过多信道语音处理模型处理待处理的多声道音频信号,输出高区分性的多信道声纹特征。本发明旨在提高多信道场景下说话人验证的准确性和鲁棒性,显著降低错误率并提升系统对复杂声学环境的适应能力。
技术关键词
多信道 预训练模型 多声道 音频 声纹特征 多阶段 联合注意力机制 信道特征 语音信号处理 前馈神经网络 模型训练模块 摘要 通道 鲁棒性 数据获取模块