摘要
本发明涉及会议室音响控制技术领域,尤指一种基于人工智能的多媒体会议室音响系统,通过人员定位模块实时获取参会人员的图像位置与头部姿态,结合麦克风布局自动建立人员与通道的空间映射关系,实现麦克风通道的动态绑定。基于音频数据的语音活动检测自动识别主发言通道,并通过音响输出模块对通道增益进行差异化控制,有效抑制非发言麦克风的背景噪声。通过提取主发言者的行为特征和交互意图,基于强化学习模型对行为特征与交互意图进行联合建模,实现对下一发言者的预测及主通道的动态更新,并基于发言反馈持续优化策略参数。实现减少人工操作,提高语音输出清晰度与会议交互的自然流畅性。