摘要
本申请涉及网络直播领域,公开一种直播间语音对话变声方法及其装置、设备、介质,所述方法包括:响应直播间中发言用户的语音发言事件,检测确定目标音频数据中的语音片段;根据预设的目标音高值,对所述语音片段的片段音高特征进行变调处理,得到调优音高特征;基于所述调优音高特征和目标音色特征,对所述语音片段做变声处理,得到变声片段;将所述变声片段替换所述目标音频数据中的相应语音片段,得到变声音频数据,将所述变声音频数据发送给所述直播间中的受话用户。本申请显著提升了语音变声技术的性能,解决了传统技术中的实时性、个性化服务、音高调整自然性以及音色真实还原等方面的问题。