一种针对输入的语音生成语音答复的方法和装置

申请号：CN202510422174

申请日期：2025-04-03

公开号：CN120452439A

公开日期：2025-08-08

类型：发明专利

摘要

本说明书实施例提供了一种针对输入的语音生成语音答复的方法和装置，该方法包括：获取用户输入的第一语音，将第一语音输入语音编码器，得到第一特征；通过预设大语言模型，基于第一特征，得到第二特征；通过依次串连的语音解码器和N个语音预测器，基于第二特征得到顺序排列的N+1个第一词元特征，其中，语音解码器基于第二特征输出N+1个第一词元特征中的第一个第一词元特征，N个语音预测器中的第i个语音预测器基于N+1个第一词元特征中的第i个第一词元特征输出第i+1个第一词元特征；基于N+1个第一词元特征，生成语音答复。

技术关键词

语音解码器生成语音大语言模型语音编码器语音适配器处理单元标签计算机可读存储介质文本存储器处理器网络参数