摘要
本发明涉及人工智能技术领域,本方案可应用于金融、医疗领域,本发明提供了一种对话语音生成方法、装置、设备及介质,方法包括:利用大型语言模型将输入的文本摘要转换为具有多角色交互特征的对话式文本结构;为对话式文本结构中的每个代理角色分配唯一的标签特征;根据标签特征从预设语音库中自动匹配与各代理角色相符的声学特征参数;通过语音合成模型根据每个代理角色的声学特征参数将对话式文本结构转换为对话语音并进行输出。本发明实施例可将输入的文本摘要转换为具有多角色交互特征的对话式文本结构,满足听众对深度讨论和专业见解的需求,还可根据每个代理角色的声学特征参数将对话式文本结构转换为兼具内容深度和表现力的对话语音。