一种基于多模态理解的数字人交互方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态理解的数字人交互方法及系统
申请号:CN202411651766
申请日期:2024-11-19
公开号:CN119538967A
公开日期:2025-02-28
类型:发明专利
摘要
本发明涉及一种基于多模态理解的数字人交互方法及系统,属于数字人智能交互技术领域。其中,该方法包括:获取多模态数据,根据多模态数据通过特征提取模型得到多模态特征;根据多模态特征通过知识增强模型得到增强模态特征;根据增强模态特征通过图表示学习模型得到模态融合特征向量;大语言模型通过多头注意力机制学习模态融合特征向量得到自然语言输出。实现了数字人对于多模态数据的理解,提高了数字人交互过程中的平滑度、自然性和智能化。
技术关键词
人交互方法 多模态特征 特征提取模型 多头注意力机制 交互模型 多模态注意力 大语言模型 计算机可执行指令 邻居 数据 自然语言 标签 音频特征 智能交互技术 节点特征 BERT模型