基于一致性与差异性解耦的多模态意图识别方法及系统

申请号：CN202510726590

申请日期：2025-06-03

公开号：CN120654179A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及基于一致性与差异性解耦的多模态意图识别方法及系统，分别对文本、视频和音频模态的特征进行一致性建模与差异性建模，一致性建模用于提取各模态中表达相似含义的共有信息，差异性建模用于保留每种模态中特有的、但可能具有重要补充价值的信息；通过构建共享‑私有特征空间，对一致性特征中的共性信息，与差异性特征中特有信息进行显式建模，将一致性特征和差异性特征融合；基于融合后的特征表示，经过分类器判断用户的真实意图，并输出结果。通过一致性与差异性协同建模，结合共享‑私有特征空间，显式建模各模态之间的语义一致性与差异性，从根本上提升意图识别的准确性与鲁棒性。

技术关键词

意图识别方法音频特征视频序列特征动态门控联合注意力机制通道语义分类器文本跨模态全局平均池化编码器时序结构多模态特征关系建模