对话语音生成方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
对话语音生成方法、装置、设备及介质
申请号:CN202510696766
申请日期:2025-05-27
公开号:CN120375802A
公开日期:2025-07-25
类型:发明专利
摘要
本发明涉及人工智能技术领域,本方案可应用于金融、医疗领域,本发明提供了一种对话语音生成方法、装置、设备及介质,方法包括:利用大型语言模型将输入的文本摘要转换为具有多角色交互特征的对话式文本结构;为对话式文本结构中的每个代理角色分配唯一的标签特征;根据标签特征从预设语音库中自动匹配与各代理角色相符的声学特征参数;通过语音合成模型根据每个代理角色的声学特征参数将对话式文本结构转换为对话语音并进行输出。本发明实施例可将输入的文本摘要转换为具有多角色交互特征的对话式文本结构,满足听众对深度讨论和专业见解的需求,还可根据每个代理角色的声学特征参数将对话式文本结构转换为兼具内容深度和表现力的对话语音。
技术关键词
语音生成方法 标签特征 交互特征 文本 韵律特征参数 摘要 节目 转换单元 脚本 处理器 人工智能技术 分配单元 生成装置 偏差 风格 可读存储介质 关系 存储器 逻辑
系统为您推荐了相关专利信息
心血管病患者 多源异构数据 患者心理 动态更新 疾病
池化特征 内容生成方法 视觉特征 输出特征 文本编码器
监督学习模型 监督学习框架 无标签样本 深度学习模型 非暂态计算机可读存储介质
数据提取方法 贪心算法 接触网 线路 数据提取系统
带电粒子显微镜 自然语言 大语言模型 计算机可执行组件 扫描电子显微镜