一种基于AI大模型的音响交互意图识别与智能决策方法
申请号:CN202510645816
申请日期:2025-05-20
公开号:CN120279910A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种基于AI大模型的音响交互意图识别与智能决策方法,涉及智能语音交互技术领域,包括,通过声学传感器采集语音信号并进行降噪处理和声学特征提取,同时捕获文本指令进行语义分句和文本特征提取,将声学特征向量与文本特征向量拼接形成多模态数据包;基于强化融合特征向量检索历史记忆库生成记忆上下文向量,通过两阶段意图推理模型识别主意图类别并解析操作参数,输出结构化意图指令;对结构化意图指令进行参数合法性校验、设备状态验证及安全风险评估,修正异常参数后封装为可执行指令集。本发明通过频带能量占比与词项重要性评分的双重筛选,使声学‑文本特征尺度差异降低。
技术关键词
智能决策方法
意图识别
意图指令
文本特征向量
音响
信噪比估计值
智能语音交互技术
声学传感器
记忆
掩码矩阵
两阶段
注意力机制
语义特征
融合特征
参数
多模态