摘要
本发明涉及耳机自适应音频均衡方法技术领域,特别是一种基于深度强化学习的耳机自适应音频均衡方法,包括以下步骤:(1)构建强化学习环境;(2)同步EQ参数调节过程、声音播放和听音者反馈过程;(3)将EQ调节策略学习过程分为训练阶段和在线调节阶段;(4)使用改进的A3算法提取音频声学特征并判断音频类型;(5)得到神经网络Q函数;(6)将EQ参数调节定义为马尔可夫决策过程MDP,输出每个音频类型对应的EQ参数调节策略集合;(7)得到策略价值并归一化;(8)EQ自适应滤波,对耳机进行参数调节,通过将耳机均衡器参数作为强化学习的动作,本发明建立了一个直接且高效的参数优化机制。