摘要
本发明涉及语音识别技术领域,具体涉及一种基于视频话机语音识别的校园霸凌行为检测方法及系统。通过获取视频话机监控区域内的声音信号和连续图像帧,实现了视觉与听觉信息的有效融合,从而更全面地捕捉和分析校园内的异常情况。识别图像帧中人物的特征点并追踪其位置变化,结合人物间的位置分布,得到监控区域内人物的聚集特征值,该值对识别潜在霸凌场景具有重要意义。在聚集特征值异常时,进一步对声音信号进行分析,划分声音数据段并提取声学特征,计算每个声音数据段的异常因子。最后,综合所有声音数据段的异常因子和人物聚集特征值,得到异常特征值进行校园霸凌行为的监测,降低了漏报和误报的风险。