基于人工智能的音频优化方法、装置、计算机设备及介质

申请号：CN202411731929

申请日期：2024-11-27

公开号：CN119559960B

公开日期：2025-11-14

类型：发明专利

摘要

本发明涉及音频处理技术领域，尤其涉及一种基于人工智能的音频优化方法、装置、计算机设备及介质。该方法使用线性层对待优化音频的频谱包络映射得到包络特征，使用嵌入层将标准音频参数嵌入为参数特征，使用预测模型对包络特征和参数特征的融合特征预测，得到预测音高曲线，使用加噪模型对待优化音频的梅尔频谱加噪，得到加噪结果，使用噪声估计模型计算加噪结果的噪声，得到预测噪声，根据预测噪声、真实噪声和预测音高曲线，更新噪声估计模型，使用更新好的噪声估计模型计算加噪结果的参考噪声，根据参考噪声对加噪结果去噪，得到优化后的梅尔频谱，结合音高信息优化噪声估计模型，使得去噪过程满足音高需求，提高了音频优化的效果。

技术关键词

音频优化方法包络融合特征参数样本计算机设备数据曲线优化装置线性优化噪声生成随机数可读存储介质噪声预测特征提取模块处理器模型更新