摘要
本申请一些实施例提供一种显示设备、服务器及唤醒词检测方法,所述方法可以响应于语音唤醒指令,获取连续多帧音频数据。并对多帧音频数据执行第一特征提取,以及将第一声学特征输入至声学模型,以得到第一概率值。若第一概率值大于第一阈值,则对音频数据执行第二特征提取,以及将第二声学特征输入至第一分类模型,以得到音频数据包含唤醒词的第一分类概率和音频数据包含常规词的第二分类概率。若第一分类概率大于第二分类概率,则生成唤醒指令,以及响应于唤醒指令,唤醒语音助手。所述方法采用多个模型对音频数据进行多次唤醒词检测,可以解决唤醒词检测技术的识别准确率低、唤醒率差且难以在算力低的平台上部署的问题。