一种歌声转换方法及歌声转换系统

申请号：CN202411689547

申请日期：2024-11-25

公开号：CN119181370B

公开日期：2025-07-04

类型：发明专利

摘要

本发明涉及音频处理技术领域，尤其是指一种歌声转换方法及歌声转换系统，所述方法包括：对获取的原始音频数据进行人声分离，得到干净人声数据；对所述干净人声数据进行切片处理，去除静默声音，得到人声切片数据；将所述人声切片数据作为训练数据集，构建歌声转换模型，以最小化损失函数的值为目标，通过所述训练数据集对所述歌声转换模型进行训练，得到训练后的歌声转换模型；将待转换的音频数据输入到所述训练后的歌声转换模型中，得到最终的目标歌声。本发明综合了精细的音频预处理、创新的模型架构与特征提取方法、以及灵活的损失函数设计，实现了高效且高质量的歌声转换。

技术关键词

人声转换方法音频音色特征语义特征 BERT模型数据获取模块切片特征提取模型依赖特征文本计算方法语音特征发声损失函数设计特征提取方法采样点频率转换