摘要
一种展厅语音交互方法及系统,所述方法包括:采集展厅的环境数据和用户声源数据;根据环境数据和用户声源数据判断是否需要移动追踪声源;基于用户声源数据和用户视觉数据对用户进行定位追踪;在不需要移动追踪声源时,将环境数据、用户相关数据和机器人上RFID读取器读取的展品信息数据进行融合,生成场景状态特征向量;对场景状态特征向量进行解析,并根据解析获得的当前展厅环境噪声等级、用户参观行为、用户位置、用户兴趣权重选择最优语音识别模型后,对用户的问题进行识别,针对用户的问题生成匹配的回答,并将匹配的回答输出给用户。本申请能够提升对声源位置的动态追踪能力,提升展厅语音交互系统的性能和用户体验。