流式语音交互方法及相关装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
流式语音交互方法及相关装置、设备和存储介质
申请号:CN202510026410
申请日期:2025-01-08
公开号:CN119479620B
公开日期:2025-05-30
类型:发明专利
摘要
本申请公开了一种流式语音交互方法及相关装置、设备和存储介质,其中,流式语音交互方法包括:对流式语音进行端点检测,并响应于检测到流式语音的起始端点,对流式语音执行滑窗操作,得到语音帧,基于语音帧进行特征提取,得到语音帧的语音特征;输入语音帧的语音特征至用于识别流式语音的语音识别系统,得到语音帧的识别结果,基于语音帧的编码特征进行分类预测,得到语音帧的分类结果;响应于分类结果表征语义结束,基于从起始端点至结束端点各个语音帧的识别结果,得到识别文本,至少基于识别文本由智能对话模型进行处理,生成得到回复文本;响应于分类结果表征语义未结束,继续返回执行滑窗操作。上述方案,能够提升流式语音交互的适时性。
技术关键词
智能对话模型 文本 语音交互方法 端点 语音特征 语音识别系统 编码特征 语义 语音交互方式 语音交互装置 指令 意图识别 程序 处理器 可读存储介质 模块 存储器