一种基于AI大模型的音响交互意图识别与智能决策方法

申请号：CN202510645816

申请日期：2025-05-20

公开号：CN120279910A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了一种基于AI大模型的音响交互意图识别与智能决策方法，涉及智能语音交互技术领域，包括，通过声学传感器采集语音信号并进行降噪处理和声学特征提取，同时捕获文本指令进行语义分句和文本特征提取，将声学特征向量与文本特征向量拼接形成多模态数据包；基于强化融合特征向量检索历史记忆库生成记忆上下文向量，通过两阶段意图推理模型识别主意图类别并解析操作参数，输出结构化意图指令；对结构化意图指令进行参数合法性校验、设备状态验证及安全风险评估，修正异常参数后封装为可执行指令集。本发明通过频带能量占比与词项重要性评分的双重筛选，使声学‑文本特征尺度差异降低。

技术关键词

智能决策方法意图识别意图指令文本特征向量音响信噪比估计值智能语音交互技术声学传感器记忆掩码矩阵两阶段注意力机制语义特征融合特征参数多模态