情感表达的语音克隆方法、装置、设备和介质

申请号：CN202511280700

申请日期：2025-09-09

公开号：CN120783724B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种情感表达的语音克隆方法、装置、设备和介质。所述语音克隆方法包括：获取可以捕捉到更多用户情感信息的用户语音信号，对用户语音信号进行包含噪声去除的预处理，提取预处理后的语音信号的声纹特征，并基于声纹特征和声纹克隆模型进行声纹克隆，以及根据用户语音信号对用户语音信号的情感类型进行分析，并根据分析结果对克隆声纹进行调整，得到更能表达用户情感的目标声纹；最后将目标声纹转换成目标语音信号，并以大于80dB的音量输出。因此，所述语音克隆方法可以较准确捕捉和重现用户声音的情感语调，实现用户复杂的情感表达，使得克隆语音更具自然和生动性，可适应于需要细腻情感表达的场景。

技术关键词

特征提取模型语音克隆方法声纹特征指向性麦克风信号深度神经网络模型支持向量机算法线性预测编码径向基核函数频率采样率特征提取模块特征值存储器噪声处理器输出模块分析模块