数字人语音交互的处理方法、装置、电子设备和介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数字人语音交互的处理方法、装置、电子设备和介质
申请号:CN202411613352
申请日期:2024-11-12
公开号:CN119495298B
公开日期:2025-09-23
类型:发明专利
摘要
本公开提供了一种数字人语音交互的处理方法、装置、电子设备和介质,涉及自然语言处理技术领域,尤其涉及语音识别、语义识别、智能体和生成式搜索技术领域。实现方案为:响应于接收到第一音频数据,获取数字人的第一声纹数据,其中,第一音频数据指示用户向数字人发起语音交互请求,第一声纹数据指示数字人当前进行语音播报所使用的声纹数据;响应于接收到第二音频数据,基于第一声纹数据对第二音频数据进行第一降噪处理,得到第三音频数据,其中,接收到第二音频数据的时间在接收到第一音频数据的时间之后;以及响应于根据第三音频数据确定用户发出指示中断语音交互的第一指令,生成停止指令并发送至数字人以控制数字人停止语音播报。
技术关键词
音频 数据 语音识别模型 文本 深度学习网络模型 指令 降噪模块 显示设备 识别模块 电子设备 搜索技术 计算机程序产品 子模块 处理器通信 自然语言 输出模块