摘要
本发明涉及音频处理技术领域,尤其是指一种歌声转换方法及歌声转换系统,所述方法包括:对获取的原始音频数据进行人声分离,得到干净人声数据;对所述干净人声数据进行切片处理,去除静默声音,得到人声切片数据;将所述人声切片数据作为训练数据集,构建歌声转换模型,以最小化损失函数的值为目标,通过所述训练数据集对所述歌声转换模型进行训练,得到训练后的歌声转换模型;将待转换的音频数据输入到所述训练后的歌声转换模型中,得到最终的目标歌声。本发明综合了精细的音频预处理、创新的模型架构与特征提取方法、以及灵活的损失函数设计,实现了高效且高质量的歌声转换。