跨语言AI声纹克隆方法、系统及其存储介质

申请号：CN202511280629

申请日期：2025-09-09

公开号：CN120766655B

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及语音识别技术领域，具体公开跨语言AI声纹克隆方法、系统及其存储介质，该方法包括：语音收集端对原始麦克风语音进行门控，合格样本进入预处理，门控、受限频谱、统一条件信号贯通上下游，显著提升噪声/回声下的稳健性；语音处理端以AI自适应滤波去噪，并按受限参数得到表征数据；特征提取识别端从频谱提取声纹嵌入并行识别语言，将声纹‑语言‑质量关联存储；声纹克隆端在模板库做余弦检索获相似队列，经质量与语种一致性重排后加权聚合得目标模板，小样本适配提升跨语种泛化与可扩展性；最后获取目标语言，结合目标模板生成克隆语音。

技术关键词

声纹特征克隆方法队列分辨率模板复杂度信噪比麦克风设备频率克隆系统回声滤波算法生成用户音频短时傅里叶变换偏差语音识别技术存储单元