摘要
本发明涉及语音识别技术领域,具体公开跨语言AI声纹克隆方法、系统及其存储介质,该方法包括:语音收集端对原始麦克风语音进行门控,合格样本进入预处理,门控、受限频谱、统一条件信号贯通上下游,显著提升噪声/回声下的稳健性;语音处理端以AI自适应滤波去噪,并按受限参数得到表征数据;特征提取识别端从频谱提取声纹嵌入并行识别语言,将声纹‑语言‑质量关联存储;声纹克隆端在模板库做余弦检索获相似队列,经质量与语种一致性重排后加权聚合得目标模板,小样本适配提升跨语种泛化与可扩展性;最后获取目标语言,结合目标模板生成克隆语音。