摘要
本公开提供了一种数字人语音交互的处理方法、装置、电子设备和介质,涉及自然语言处理技术领域,尤其涉及语音识别、语义识别、智能体和生成式搜索技术领域。实现方案为:响应于接收到第一音频数据,获取数字人的第一声纹数据,其中,第一音频数据指示用户向数字人发起语音交互请求,第一声纹数据指示数字人当前进行语音播报所使用的声纹数据;响应于接收到第二音频数据,基于第一声纹数据对第二音频数据进行第一降噪处理,得到第三音频数据,其中,接收到第二音频数据的时间在接收到第一音频数据的时间之后;以及响应于根据第三音频数据确定用户发出指示中断语音交互的第一指令,生成停止指令并发送至数字人以控制数字人停止语音播报。