摘要
本发明提供一种智能体对话系统及方法,涉及音频转换技术领域,包括:采集模块用于获取用户的音频数据;音频转换模块用于根据用户端的数据网络信号强度,设置音频数据的传输方式,当传输方式为通信信号传输时,将音频数据进行编码处理得到音频流;语音识别处理模块用于根据音频流进行实时解析,得到解析结果,并通过语言声学模型对解析结果进行优化,得到文字信息;意图识别与回答模块用于根据文字信生成音频数据的回答文字;语音合成模块用于对回答文字进行语音合成,得到回答文字的音频数据。本发明采用文字传输代替音频流,显著降低了数据传输量,提高了传输效率,减少了因网络拥塞导致的延迟和错误,提高了智能体音频对话的稳定性。