一种基于AI的多线益智互动方法及玩具

申请号：CN202511283401

申请日期：2025-09-09

公开号：CN121011189A

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及语音识别技术领域，具体涉及一种基于AI的多线益智互动方法及玩具，方法包括：建立语音互动识别会话并在接收开始指令后初始化；连续接收音频片段写入语音特征缓冲区；对片段提取帧级特征入缓冲，当累计超过第一数值长度，提取该长度的序列为批次，并获取其后的第二数值作为右侧上下文；按第三数值将批次切分为子块，并为每块拼接左右上下文形成CSC序列，组合为CSC特征矩阵送入声学模型并行计算声学分数；基于分数以语音活动检测模型检测短暂停顿，触发回溯、阶段性输出与状态重置；再以维特比结合语言模型搜索得到最终识别文本。本发明可以解决智能玩具语音互动中响应时延长、多人并发易串线与停顿误判导致的交互不连贯问题。

技术关键词

神经网络声学模型互动方法双向长短期记忆语音活动检测分块特征序列音频语音特征提取益智互动玩具数值上下文特征存储计算机可执行指令解码数据传输开销多通道并行语音识别技术分块策略深度神经网络