一种基于有限状态机的自定义语音唤醒词检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于有限状态机的自定义语音唤醒词检测方法
申请号:CN202411878653
申请日期:2024-12-19
公开号:CN119724161A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种基于有限状态机的自定义语音唤醒词检测方法,包括如下步骤:利用互联网上的开源中文语音数据集训练Transformer网络模型;对输入的语音信号进行分帧加窗处理,并提取对应的特征;将提取的特征输入到Transformer网络模型中,生成帧概率张量;配置目标唤醒词内容并获得目标唤醒词对应的声韵母拼音序列,并构建有限状态机解码网络;对帧概率张量进行处理生成新的帧概率张量;将新的帧概率张量输入有限状态机解码网络,运行维特比算法,搜索最优音素路径;计算所有音素状态得分的平均值,与预设门限值进行比较,当超过时激活唤醒词。本发明结合Transformer模型和有限状态机技术,实现自定义语音唤醒词检测,具备灵活配置、低功耗运行、高精度和强鲁棒性的优点。
技术关键词
唤醒词检测方法 自定义语音 解码网络 拼音 维特比算法 序列 符号 状态机技术 信号 滑动窗口机制 短时傅里叶变换 ReLU函数 离散余弦变换 节点 互联网 采样率