数字人语音交互的处理方法、装置、电子设备和介质

申请号：CN202411613352

申请日期：2024-11-12

公开号：CN119495298B

公开日期：2025-09-23

类型：发明专利

摘要

本公开提供了一种数字人语音交互的处理方法、装置、电子设备和介质，涉及自然语言处理技术领域，尤其涉及语音识别、语义识别、智能体和生成式搜索技术领域。实现方案为：响应于接收到第一音频数据，获取数字人的第一声纹数据，其中，第一音频数据指示用户向数字人发起语音交互请求，第一声纹数据指示数字人当前进行语音播报所使用的声纹数据；响应于接收到第二音频数据，基于第一声纹数据对第二音频数据进行第一降噪处理，得到第三音频数据，其中，接收到第二音频数据的时间在接收到第一音频数据的时间之后；以及响应于根据第三音频数据确定用户发出指示中断语音交互的第一指令，生成停止指令并发送至数字人以控制数字人停止语音播报。

技术关键词

音频数据语音识别模型文本深度学习网络模型指令降噪模块显示设备识别模块电子设备搜索技术计算机程序产品子模块处理器通信自然语言输出模块