摘要
本发明公开了一种用于语音分离和目标语音提取的通用模型,涉及语音领域,包括分离网络、EDA模块和线索网络三个部分;所述分离网络基于频带划分递归神经网络,即BSRNN,是一种频域分离网络;将所述EDA模块引入频域语音分离模型BSRNN,使其具备处理未知、可变说话人数量的混杂语音的能力;使用RawNet3作为所述线索网络,实现目标语音提取的功能。本模型能根据输入的不同在不同的任务间灵活切换,实现“通用”的效果,使模型的灵活性和泛用性大大提高,进而也避免了针对不同任务使用不同模型带来的额外开销,降低了成本。