一种基于AI的多线益智互动方法及玩具

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于AI的多线益智互动方法及玩具
申请号:CN202511283401
申请日期:2025-09-09
公开号:CN121011189A
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及语音识别技术领域,具体涉及一种基于AI的多线益智互动方法及玩具,方法包括:建立语音互动识别会话并在接收开始指令后初始化;连续接收音频片段写入语音特征缓冲区;对片段提取帧级特征入缓冲,当累计超过第一数值长度,提取该长度的序列为批次,并获取其后的第二数值作为右侧上下文;按第三数值将批次切分为子块,并为每块拼接左右上下文形成CSC序列,组合为CSC特征矩阵送入声学模型并行计算声学分数;基于分数以语音活动检测模型检测短暂停顿,触发回溯、阶段性输出与状态重置;再以维特比结合语言模型搜索得到最终识别文本。本发明可以解决智能玩具语音互动中响应时延长、多人并发易串线与停顿误判导致的交互不连贯问题。
技术关键词
神经网络声学模型 互动方法 双向长短期记忆 语音活动检测 分块特征 序列 音频 语音特征提取 益智互动玩具 数值 上下文特征 存储计算机可执行指令 解码 数据传输开销 多通道并行 语音识别技术 分块策略 深度神经网络