基于少样本学习的语音合成方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于少样本学习的语音合成方法、装置、设备及介质
申请号:CN202510021659
申请日期:2025-01-07
公开号:CN119964545A
公开日期:2025-05-09
类型:发明专利
摘要
本发明涉及人工智能技术领域,揭示了一种基于少样本学习的语音合成方法、装置、设备及介质,方法包括获取少样本语音合成模型的训练数据集,训练数据集包括多个说话人的若干段训练语音信息和与每段训练语音分别对应的训练文本信息;基于训练数据集训练少样本语音合成模型;获取待合成语音的应用文本信息;获取待合成语音的目标说话人信息;将应用文本信息和目标说话人信息输入至少样本语音合成模型,输出应用文本信息对应的应用语音信息,应用语音信息以目标说话人的声学特征来发声。本发明可以在有限的数据样本下快速生成具有目标说话人声学特征的逼真语音,降低了对大量训练数据的依赖,还提高了语音合成的灵活性和效率。
技术关键词
语音 声学特征 文本 样本 编码向量 编码器模块 参数 解码模块 模型训练模块 处理器 适配器 发声 人工智能技术 数据获取模块 计算机设备 可读存储介质 变量 存储器
系统为您推荐了相关专利信息
个性化知识图谱 实体 文本 阶段 关系
溢油事件 样本 解译方法 无监督 数据
语音识别模型 关键词 语音特征 语音识别方法 样本
文本 大语言模型 编码向量 创作方法 分词
语音 音频 文本 声纹特征 矩阵