摘要
本申请属于智能交互技术领域,公开了一种基于语音识别的对话交互方法及装置,该方法包括:获取音频数据,并对音频数据进行预处理,得到短时信号;提取短时信号中的音频特征信息;将音频特征信息输入全协方差的高斯混合模型,得到真人可能性评分;若真人可能性评分大于预设阈值,则将音频数据转换为文本数据对文本数据进行意图识别、实体识别和情感识别,得到识别结果;根据识别结果在对应的行业数据库中匹配对答文本;将对答文本转换为语音数据,并播放语音数据。本申请能够捕捉到短时信号的多样性和复杂性,提高音频识别的鲁棒性和准确性,避免对话引擎与非人对话,节省计算资源。