跨语言AI声纹克隆方法、系统及其存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
跨语言AI声纹克隆方法、系统及其存储介质
申请号:CN202511280629
申请日期:2025-09-09
公开号:CN120766655B
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及语音识别技术领域,具体公开跨语言AI声纹克隆方法、系统及其存储介质,该方法包括:语音收集端对原始麦克风语音进行门控,合格样本进入预处理,门控、受限频谱、统一条件信号贯通上下游,显著提升噪声/回声下的稳健性;语音处理端以AI自适应滤波去噪,并按受限参数得到表征数据;特征提取识别端从频谱提取声纹嵌入并行识别语言,将声纹‑语言‑质量关联存储;声纹克隆端在模板库做余弦检索获相似队列,经质量与语种一致性重排后加权聚合得目标模板,小样本适配提升跨语种泛化与可扩展性;最后获取目标语言,结合目标模板生成克隆语音。
技术关键词
声纹特征 克隆方法 队列 分辨率 模板 复杂度 信噪比 麦克风设备 频率 克隆系统 回声 滤波算法 生成用户 音频 短时傅里叶变换 偏差 语音识别技术 存储单元