对话语音生成方法、装置、设备及介质

申请号：CN202510696766

申请日期：2025-05-27

公开号：CN120375802A

公开日期：2025-07-25

类型：发明专利

摘要

本发明涉及人工智能技术领域，本方案可应用于金融、医疗领域，本发明提供了一种对话语音生成方法、装置、设备及介质，方法包括：利用大型语言模型将输入的文本摘要转换为具有多角色交互特征的对话式文本结构；为对话式文本结构中的每个代理角色分配唯一的标签特征；根据标签特征从预设语音库中自动匹配与各代理角色相符的声学特征参数；通过语音合成模型根据每个代理角色的声学特征参数将对话式文本结构转换为对话语音并进行输出。本发明实施例可将输入的文本摘要转换为具有多角色交互特征的对话式文本结构，满足听众对深度讨论和专业见解的需求，还可根据每个代理角色的声学特征参数将对话式文本结构转换为兼具内容深度和表现力的对话语音。

技术关键词

语音生成方法标签特征交互特征文本韵律特征参数摘要节目转换单元脚本处理器人工智能技术分配单元生成装置偏差风格可读存储介质关系存储器逻辑

系统为您推荐了相关专利信息

基于知识图谱的心血管病患者心理障碍干预装置

心血管病患者多源异构数据患者心理动态更新疾病

内容生成方法、装置、电子设备及存储介质

池化特征内容生成方法视觉特征输出特征文本编码器

一种高效且高兼容性的半监督学习模型训练方法及设备

监督学习模型监督学习框架无标签样本深度学习模型非暂态计算机可读存储介质

基于贪心算法的接触网设计用数据提取方法及系统

数据提取方法贪心算法接触网线路数据提取系统

用于带电粒子显微镜操作的大语言模型辅助

带电粒子显微镜自然语言大语言模型计算机可执行组件扫描电子显微镜