一种基于伴奏分离和人声分离的戏曲人声提取方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于伴奏分离和人声分离的戏曲人声提取方法及系统
申请号:CN202410833330
申请日期:2024-06-26
公开号:CN118737184A
公开日期:2024-10-01
类型:发明专利
摘要
本发明公开了一种基于伴奏分离和人声分离的戏曲人声提取方法及系统,包括以下步骤:在若干音频数据中筛选出包含戏曲人声的音频数据,并基于包含戏曲人声的音频数据形成目标音频数据集;将目标音频数据集采用基于频率特征的分离方法进行伴奏分离,得到分离音频数据集;对分离音频数据集采用基于音色的人声分离方法进行戏曲人声分离,得到戏曲人声数据集;将戏曲人声数据集输入到CVAE编码器筛选戏曲人声,并形成隐空间特征集;基于外部条件通过解码器从隐空间特征集提取隐空间特征点,并基于隐空间特征点输出戏曲人声。本发明用于解决戏曲人声与二胡声难以分离的技术问题,达到提高人声模型的声音质量的目的。
技术关键词
人声提取方法 音色特征 音频 特征参数提取 短时傅里叶变换 特征点 协方差矩阵 拉格朗日 人声模型 解码器 编码器 频率 冗余 数据采集单元 信号 特征值 解码单元