一种基于人工智能的多媒体会议室音响系统

申请号：CN202511005194

申请日期：2025-07-21

公开号：CN120812477A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及会议室音响控制技术领域，尤指一种基于人工智能的多媒体会议室音响系统，通过人员定位模块实时获取参会人员的图像位置与头部姿态，结合麦克风布局自动建立人员与通道的空间映射关系，实现麦克风通道的动态绑定。基于音频数据的语音活动检测自动识别主发言通道，并通过音响输出模块对通道增益进行差异化控制，有效抑制非发言麦克风的背景噪声。通过提取主发言者的行为特征和交互意图，基于强化学习模型对行为特征与交互意图进行联合建模，实现对下一发言者的预测及主通道的动态更新，并基于发言反馈持续优化策略参数。实现减少人工操作，提高语音输出清晰度与会议交互的自然流畅性。

技术关键词

多媒体会议室音响系统强化学习模型麦克风身份通道音频发言人定位模块头部姿态估计标识执行语音识别实时语音意图图像会议室音响执行人脸识别输出模块