基于人工智能的音频优化方法、装置、计算机设备及介质
申请号:CN202411731929
申请日期:2024-11-27
公开号:CN119559960B
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及音频处理技术领域,尤其涉及一种基于人工智能的音频优化方法、装置、计算机设备及介质。该方法使用线性层对待优化音频的频谱包络映射得到包络特征,使用嵌入层将标准音频参数嵌入为参数特征,使用预测模型对包络特征和参数特征的融合特征预测,得到预测音高曲线,使用加噪模型对待优化音频的梅尔频谱加噪,得到加噪结果,使用噪声估计模型计算加噪结果的噪声,得到预测噪声,根据预测噪声、真实噪声和预测音高曲线,更新噪声估计模型,使用更新好的噪声估计模型计算加噪结果的参考噪声,根据参考噪声对加噪结果去噪,得到优化后的梅尔频谱,结合音高信息优化噪声估计模型,使得去噪过程满足音高需求,提高了音频优化的效果。
技术关键词
音频优化方法
包络
融合特征
参数
样本
计算机设备
数据
曲线
优化装置
线性
优化噪声
生成随机数
可读存储介质
噪声预测
特征提取模块
处理器
模型更新