基于条件流匹配模型的语音生成方法、装置及相关组件

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于条件流匹配模型的语音生成方法、装置及相关组件
申请号:CN202510222737
申请日期:2025-02-26
公开号:CN119993115B
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及人工智能领域,公开了基于条件流匹配模型的语音生成方法、装置、计算机设备及存储介质,该方法包括:获取已生成语音的训练文本,并将其语音作为训练语音;采样噪声数据,将训练文本、训练语音以及噪声数据输入至条件流匹配模型中进行训练;利用可变步长对所述条件流匹配模型进行推理,以得到关于噪声和语音的向量场;基于所述条件流匹配模型和向量场构建得到语音生成模型,并利用所述语音生成模型对待生成语音的目标文本进行推理预测。本发明实施例利用已生成语音的文本来训练条件流匹配模型,以此构建语音生成模型,并且在条件流匹配模型的训练过程中,采用可变步长进行推理求解,如此不仅能够快速生成语音,还能够提高语音生成质量。
技术关键词
语音生成方法 语音生成模型 噪声数据 生成语音 文本 表达式 计算机设备 可读存储介质 编码 处理器 生成装置 格式 存储器 速度 方程 信号