摘要
本发明涉及基于一致性与差异性解耦的多模态意图识别方法及系统,分别对文本、视频和音频模态的特征进行一致性建模与差异性建模,一致性建模用于提取各模态中表达相似含义的共有信息,差异性建模用于保留每种模态中特有的、但可能具有重要补充价值的信息;通过构建共享‑私有特征空间,对一致性特征中的共性信息,与差异性特征中特有信息进行显式建模,将一致性特征和差异性特征融合;基于融合后的特征表示,经过分类器判断用户的真实意图,并输出结果。通过一致性与差异性协同建模,结合共享‑私有特征空间,显式建模各模态之间的语义一致性与差异性,从根本上提升意图识别的准确性与鲁棒性。