一种基于伴奏分离和人声分离的戏曲人声提取方法及系统

申请号：CN202410833330

申请日期：2024-06-26

公开号：CN118737184A

公开日期：2024-10-01

类型：发明专利

摘要

本发明公开了一种基于伴奏分离和人声分离的戏曲人声提取方法及系统，包括以下步骤：在若干音频数据中筛选出包含戏曲人声的音频数据，并基于包含戏曲人声的音频数据形成目标音频数据集；将目标音频数据集采用基于频率特征的分离方法进行伴奏分离，得到分离音频数据集；对分离音频数据集采用基于音色的人声分离方法进行戏曲人声分离，得到戏曲人声数据集；将戏曲人声数据集输入到CVAE编码器筛选戏曲人声，并形成隐空间特征集；基于外部条件通过解码器从隐空间特征集提取隐空间特征点，并基于隐空间特征点输出戏曲人声。本发明用于解决戏曲人声与二胡声难以分离的技术问题，达到提高人声模型的声音质量的目的。

技术关键词

人声提取方法音色特征音频特征参数提取短时傅里叶变换特征点协方差矩阵拉格朗日人声模型解码器编码器频率冗余数据采集单元信号特征值解码单元