摘要
本发明涉及人工智能领域,公开了基于条件流匹配模型的语音生成方法、装置、计算机设备及存储介质,该方法包括:获取已生成语音的训练文本,并将其语音作为训练语音;采样噪声数据,将训练文本、训练语音以及噪声数据输入至条件流匹配模型中进行训练;利用可变步长对所述条件流匹配模型进行推理,以得到关于噪声和语音的向量场;基于所述条件流匹配模型和向量场构建得到语音生成模型,并利用所述语音生成模型对待生成语音的目标文本进行推理预测。本发明实施例利用已生成语音的文本来训练条件流匹配模型,以此构建语音生成模型,并且在条件流匹配模型的训练过程中,采用可变步长进行推理求解,如此不仅能够快速生成语音,还能够提高语音生成质量。