一种基于多模态理解的数字人交互方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于多模态理解的数字人交互方法及系统
申请号:
CN202411651766
申请日期:
2024-11-19
公开号:
CN119538967A
公开日期:
2025-02-28
类型:
发明专利
摘要
本发明涉及一种基于多模态理解的数字人交互方法及系统,属于数字人智能交互技术领域。其中,该方法包括:获取多模态数据,根据多模态数据通过特征提取模型得到多模态特征;根据多模态特征通过知识增强模型得到增强模态特征;根据增强模态特征通过图表示学习模型得到模态融合特征向量;大语言模型通过多头注意力机制学习模态融合特征向量得到自然语言输出。实现了数字人对于多模态数据的理解,提高了数字人交互过程中的平滑度、自然性和智能化。
技术关键词
人交互方法
多模态特征
特征提取模型
多头注意力机制
交互模型
多模态注意力
大语言模型
计算机可执行指令
邻居
数据
自然语言
标签
音频特征
智能交互技术
节点特征
BERT模型