基于条件流匹配模型的语音生成方法、装置及相关组件

申请号：CN202510222737

申请日期：2025-02-26

公开号：CN119993115B

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及人工智能领域，公开了基于条件流匹配模型的语音生成方法、装置、计算机设备及存储介质，该方法包括：获取已生成语音的训练文本，并将其语音作为训练语音；采样噪声数据，将训练文本、训练语音以及噪声数据输入至条件流匹配模型中进行训练；利用可变步长对所述条件流匹配模型进行推理，以得到关于噪声和语音的向量场；基于所述条件流匹配模型和向量场构建得到语音生成模型，并利用所述语音生成模型对待生成语音的目标文本进行推理预测。本发明实施例利用已生成语音的文本来训练条件流匹配模型，以此构建语音生成模型，并且在条件流匹配模型的训练过程中，采用可变步长进行推理求解，如此不仅能够快速生成语音，还能够提高语音生成质量。

技术关键词

语音生成方法语音生成模型噪声数据生成语音文本表达式计算机设备可读存储介质编码处理器生成装置格式存储器速度方程信号