语音数据集的生成方法及装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
语音数据集的生成方法及装置
申请号:
CN202511340288
申请日期:
2025-09-18
公开号:
CN120877702B
公开日期:
2025-12-23
类型:
发明专利
摘要
本申请公开了一种语音数据集的生成方法及装置。其中,该方法包括:获取标准通用语言的语音数据集,并采用大语言模型将标准通用语言的语音数据集转化为目标语种文本;采用检索增强生成的方式生成目标语种语句文本;根据目标语种文本和目标语种语句文本生成目标语种语音,并根据目标语种语音构建目标语音数据集,其中,目标语种语音的语音特征与和标准通用语言语音数据集的语音特征一致。本申请解决了相关技术中由于目标语种语音数据库的语音数据量较少,导致翻译模型翻译目标语种的准确性较低。
技术关键词
语音特征
文本
语音生成模型
大语言模型
生成方法
语句主题
数据
错误率
存储程序指令
翻译模型
计算机程序产品
存储器
生成装置
处理器
计算机设备
字符
音频
系统为您推荐了相关专利信息
1
基于大模型的端侧翻译方法、装置、设备及存储介质
翻译模型
策略
场景
翻译语言
移动终端
2
数据操作指令的生成方法及装置、程序产品、存储介质
关键词
数据
指令
生成方法
网络
3
一种数字人视频生成方法、装置、电子设备及存储介质
骨骼特征
词语
图像生成模型
视频生成方法
面部特征
4
外呼提醒方法、外呼提醒装置、设备及存储介质
外呼名单
场景
提醒方法
机器人
提醒装置
5
一种基于知识图谱的产品故障案例推荐方法及系统
实体
文本
推荐方法
关键词
知识图谱技术