一种基于气骨导双模的深度学习关键词识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于气骨导双模的深度学习关键词识别方法
申请号:CN202510222640
申请日期:2025-02-26
公开号:CN120071907A
公开日期:2025-05-30
类型:发明专利
摘要
本发明涉及语音识别技术领域,具体公开了一种基于气骨导双模的深度学习关键词识别方法。首先构建双模态数据集,通过同步采集纯净气导/骨导语音,并向气导语音添加环境噪声形成带噪气导信号,按比例划分训练集、验证集和测试集;其次设计Audiomer‑L神经网络模型,其包括学习向量模块通过在输入序列首部添加可学习向量,聚合分类特征信息;一系列卷积注意力模块采用带压缩激励机制的一维卷积与Performer注意力模块,通过预查询张量和上下文张量实现时序特征强化;最终通过多层感知器MLP模块完成分类决策。本发明采用固定长度分帧处理,通过端到端训练策略,在噪声环境下相比单模态系统显著提升识别准确率,适用于可穿戴设备、助听器等复杂声学场景的语音交互应用。
技术关键词
关键词识别方法 神经网络模型 注意力 卷积模块 多层感知器 分类特征 训练集 语音识别技术 声学场景 时序特征 数据 波形 音频 穿戴设备 双模态 助听器 处理单元
系统为您推荐了相关专利信息
预训练语言模型 报告 文本段落 校验方法 航空
协同控制方法 扩张状态观测器 废气 工况特征 复杂度
编码器 解码器 图像分割方法 二维快速傅里叶变换 图像重建
储能变流器 故障诊断模型 无功指令 虚拟同步发电机 深度神经网络
非线性特征提取 行星齿轮箱 Softmax函数 频域特征 随机森林