摘要
本发明公开了一种教育机器人语音信号处理方法,涉及语音信号处理技术领域,针对课堂多人叠语和环境噪声干扰难题,依托麦克风阵列与摄像头获取多通道数据,在步骤一中构建环境模型用于确定噪声基线及学生分布;在步骤二中检测重叠语音并结合到达时间差和口型数据进行声源定位;在步骤三中对目标方向执行定向增益并运用深度网络分离混叠语音;在步骤四中将分离后语音输入儿童定制识别引擎结合置信度评估完成高精度识别及互动。可以在教室混响及多人同时发言复杂场景下显著提升识别准确度与交互效率,同时通过全局环境模型追踪噪声变化使教育机器人在多样化教学互动中保持稳定识别表现,显著增强教学成效。