摘要
本发明公开了一种混合语音分离方法、装置、设备及可读存储介质,应用于语音分离领域,包括将含有语音重叠的混合语音输入至说话人提取模型的编码器中,得到输出向量;将混合语音中各个说话人的注册语音输入至声纹注册模型中,得到各个说话人的声纹特征;将各个说话人的声纹特征和输出向量依次输入至说话人提取模型的说话人提取器和解码器中,得到初始分离语音;将各个说话人的声纹特征和输出向量输入至说话人日志模型中,得到各个说话人的日志;根据初始分离语音和各个说话人的日志得到混合语音中各个说话人对应的语音。本发明将声纹注册模型、说话人日志模型和说话人提取模型进行结合,相辅相成,相互促进,共同提高混合语音分离的准确性。