一种针对输入的语音生成语音答复的方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种针对输入的语音生成语音答复的方法和装置
申请号:CN202510422174
申请日期:2025-04-03
公开号:CN120452439A
公开日期:2025-08-08
类型:发明专利
摘要
本说明书实施例提供了一种针对输入的语音生成语音答复的方法和装置,该方法包括:获取用户输入的第一语音,将第一语音输入语音编码器,得到第一特征;通过预设大语言模型,基于第一特征,得到第二特征;通过依次串连的语音解码器和N个语音预测器,基于第二特征得到顺序排列的N+1个第一词元特征,其中,语音解码器基于第二特征输出N+1个第一词元特征中的第一个第一词元特征,N个语音预测器中的第i个语音预测器基于N+1个第一词元特征中的第i个第一词元特征输出第i+1个第一词元特征;基于N+1个第一词元特征,生成语音答复。
技术关键词
语音解码器 生成语音 大语言模型 语音编码器 语音适配器 处理单元 标签 计算机 可读存储介质 文本 存储器 处理器 网络 参数