摘要
本发明涉及人工智能技术领域,揭示了一种基于少样本学习的语音合成方法、装置、设备及介质,方法包括获取少样本语音合成模型的训练数据集,训练数据集包括多个说话人的若干段训练语音信息和与每段训练语音分别对应的训练文本信息;基于训练数据集训练少样本语音合成模型;获取待合成语音的应用文本信息;获取待合成语音的目标说话人信息;将应用文本信息和目标说话人信息输入至少样本语音合成模型,输出应用文本信息对应的应用语音信息,应用语音信息以目标说话人的声学特征来发声。本发明可以在有限的数据样本下快速生成具有目标说话人声学特征的逼真语音,降低了对大量训练数据的依赖,还提高了语音合成的灵活性和效率。