情感表达的语音克隆方法、装置、设备和介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
情感表达的语音克隆方法、装置、设备和介质
申请号:CN202511280700
申请日期:2025-09-09
公开号:CN120783724B
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种情感表达的语音克隆方法、装置、设备和介质。所述语音克隆方法包括:获取可以捕捉到更多用户情感信息的用户语音信号,对用户语音信号进行包含噪声去除的预处理,提取预处理后的语音信号的声纹特征,并基于声纹特征和声纹克隆模型进行声纹克隆,以及根据用户语音信号对用户语音信号的情感类型进行分析,并根据分析结果对克隆声纹进行调整,得到更能表达用户情感的目标声纹;最后将目标声纹转换成目标语音信号,并以大于80dB的音量输出。因此,所述语音克隆方法可以较准确捕捉和重现用户声音的情感语调,实现用户复杂的情感表达,使得克隆语音更具自然和生动性,可适应于需要细腻情感表达的场景。
技术关键词
特征提取模型 语音 克隆方法 声纹特征 指向性麦克风 信号 深度神经网络模型 支持向量机算法 线性预测编码 径向基核函数 频率 采样率 特征提取模块 特征值 存储器 噪声 处理器 输出模块 分析模块
系统为您推荐了相关专利信息
人工智能语音 音频数据处理方法 深度神经网络模型 音频数据处理装置 长短期记忆网络
视频播放界面 画面 互动方法 大语言模型 视频观看体验
特征提取模型 分类阈值 风险 水文监测站 节点状态预测
文本可视化 语音编辑系统 编辑方法 音频 语音编码器
推荐话术 客户 推荐方法 语音 计算机可读指令