基于少样本学习的语音合成方法、装置、设备及介质

申请号：CN202510021659

申请日期：2025-01-07

公开号：CN119964545A

公开日期：2025-05-09

类型：发明专利

摘要

本发明涉及人工智能技术领域，揭示了一种基于少样本学习的语音合成方法、装置、设备及介质，方法包括获取少样本语音合成模型的训练数据集，训练数据集包括多个说话人的若干段训练语音信息和与每段训练语音分别对应的训练文本信息；基于训练数据集训练少样本语音合成模型；获取待合成语音的应用文本信息；获取待合成语音的目标说话人信息；将应用文本信息和目标说话人信息输入至少样本语音合成模型，输出应用文本信息对应的应用语音信息，应用语音信息以目标说话人的声学特征来发声。本发明可以在有限的数据样本下快速生成具有目标说话人声学特征的逼真语音，降低了对大量训练数据的依赖，还提高了语音合成的灵活性和效率。

技术关键词

语音声学特征文本样本编码向量编码器模块参数解码模块模型训练模块处理器适配器发声人工智能技术数据获取模块计算机设备可读存储介质变量存储器

系统为您推荐了相关专利信息

一种基于RAG技术的回答增强方法及装置

个性化知识图谱实体文本阶段关系

一种无监督域自适应的不同溢油事件迁移解译方法

溢油事件样本解译方法无监督数据

语音识别模型的训练方法、语音识别方法及设备

语音识别模型关键词语音特征语音识别方法样本

智能检索增强的文本创作方法、装置及存储介质

文本大语言模型编码向量创作方法分词

语音合成方法和装置

语音音频文本声纹特征矩阵