流式语音交互方法及相关装置、设备和存储介质

申请号：CN202510026410

申请日期：2025-01-08

公开号：CN119479620B

公开日期：2025-05-30

类型：发明专利

摘要

本申请公开了一种流式语音交互方法及相关装置、设备和存储介质，其中，流式语音交互方法包括：对流式语音进行端点检测，并响应于检测到流式语音的起始端点，对流式语音执行滑窗操作，得到语音帧，基于语音帧进行特征提取，得到语音帧的语音特征；输入语音帧的语音特征至用于识别流式语音的语音识别系统，得到语音帧的识别结果，基于语音帧的编码特征进行分类预测，得到语音帧的分类结果；响应于分类结果表征语义结束，基于从起始端点至结束端点各个语音帧的识别结果，得到识别文本，至少基于识别文本由智能对话模型进行处理，生成得到回复文本；响应于分类结果表征语义未结束，继续返回执行滑窗操作。上述方案，能够提升流式语音交互的适时性。

技术关键词

智能对话模型文本语音交互方法端点语音特征语音识别系统编码特征语义语音交互方式语音交互装置指令意图识别程序处理器可读存储介质模块存储器