摘要
本发明涉及语音识别技术领域,具体涉及一种基于AI的多线益智互动方法及玩具,方法包括:建立语音互动识别会话并在接收开始指令后初始化;连续接收音频片段写入语音特征缓冲区;对片段提取帧级特征入缓冲,当累计超过第一数值长度,提取该长度的序列为批次,并获取其后的第二数值作为右侧上下文;按第三数值将批次切分为子块,并为每块拼接左右上下文形成CSC序列,组合为CSC特征矩阵送入声学模型并行计算声学分数;基于分数以语音活动检测模型检测短暂停顿,触发回溯、阶段性输出与状态重置;再以维特比结合语言模型搜索得到最终识别文本。本发明可以解决智能玩具语音互动中响应时延长、多人并发易串线与停顿误判导致的交互不连贯问题。