多模态意图识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态意图识别方法及系统
申请号:CN202510726589
申请日期:2025-06-03
公开号:CN120654178A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及多模态意图识别方法及系统,文本、视频和音频模态的特征分别进行时域和频域增强,经拼接得到非语言模态融合特征,结合原始文本特征,分别建模音频‑文本与视频‑文本的时间同步关系,通过上下文对齐处理得到标准化的音频特征、视频特征和文本特征;融合标准化的三种模态的特征,得到融合后的特征向量,并映射回文本模态空间与原始文本特征加权残差连接得到融合语义向量;从融合语义向量中抽取全局语义锚点与掩码位置,与原始文本特征和融合语义向量拼接,得到输入特征;利用输入特征得到多意图类别的概率分布。能够支持三类异构模态输入,并通过细粒度语义监督与增强策略提升意图识别的准确性与鲁棒性。
技术关键词
音频特征 意图识别方法 融合语义 文本特征加权 融合特征 视频 多模态 意图类别 时间同步 样本 矩阵 多头注意力机制 交互注意力 LSTM模型 锚点 加权残差 感知特征
系统为您推荐了相关专利信息
梅尔频率倒谱系数 鉴别方法 融合特征 音频 声学特征
多模态信息融合 视觉定位方法 融合特征 特征提取网络 加权特征
视觉语音识别方法 视觉特征 交叉注意力机制 面部 视频
脉冲调制 多学科 参数 高压脉冲电源 生成等离子体
车载设备 地图元素 车载传感器 地图特征 路段