摘要
本说明书实施例提供了一种针对输入的语音生成语音答复的方法和装置,该方法包括:获取用户输入的第一语音,将第一语音输入语音编码器,得到第一特征;通过预设大语言模型,基于第一特征,得到第二特征;通过依次串连的语音解码器和N个语音预测器,基于第二特征得到顺序排列的N+1个第一词元特征,其中,语音解码器基于第二特征输出N+1个第一词元特征中的第一个第一词元特征,N个语音预测器中的第i个语音预测器基于N+1个第一词元特征中的第i个第一词元特征输出第i+1个第一词元特征;基于N+1个第一词元特征,生成语音答复。