一种银行柜台对讲降噪方法、装置、电子设备及存储介质
申请号:CN202411658631
申请日期:2024-11-19
公开号:CN119400194A
公开日期:2025-02-07
类型:发明专利
摘要
本发明实施例公开了一种银行柜台对讲降噪方法、装置、电子设备及存储介质。该方法包括:获取客户端的视频信息以及音频信息;所述视频信息以及音频信息由设置在柜台上内置麦克风的目标摄像头获取;将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征;确定包含上下文信息的目标音频特征,并将所述目标音频特征与视听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频。采用本发明实施例的技术方案,通过基于音视协同的语音降噪算法去过滤环境噪音以及其他客户声音,提高柜员办理业务的效率,增加用户的客户旅程体验。
技术关键词
音频特征
动作特征
银行柜台
注意力
时序特征
降噪方法
线性
计算机可执行指令
语音降噪算法
梅尔倒谱系数
视听
掩膜
音视频
麦克风
音频编码器
客户端
电子设备