摘要
本发明公开了一种基于有限状态机的自定义语音唤醒词检测方法,包括如下步骤:利用互联网上的开源中文语音数据集训练Transformer网络模型;对输入的语音信号进行分帧加窗处理,并提取对应的特征;将提取的特征输入到Transformer网络模型中,生成帧概率张量;配置目标唤醒词内容并获得目标唤醒词对应的声韵母拼音序列,并构建有限状态机解码网络;对帧概率张量进行处理生成新的帧概率张量;将新的帧概率张量输入有限状态机解码网络,运行维特比算法,搜索最优音素路径;计算所有音素状态得分的平均值,与预设门限值进行比较,当超过时激活唤醒词。本发明结合Transformer模型和有限状态机技术,实现自定义语音唤醒词检测,具备灵活配置、低功耗运行、高精度和强鲁棒性的优点。