基于多元感知的虚拟人驱动方法及装置、设备、存储介质
申请号:CN202411081931
申请日期:2024-08-08
公开号:CN119091008A
公开日期:2024-12-06
类型:发明专利
摘要
本申请涉及虚拟人驱动领域,其具体公开了一种基于多元感知的虚拟人驱动方法及装置、设备、存储介质,其使用基于深度学习领域的人工智能技术来对用户的语音和人脸图像进行特征提取与编码,得到虚拟人渲染后的RGB图像。这样,通过利用用户的多元信息,提高了虚拟人的感知和理解用户行为、情感和环境方面的能力。
技术关键词
面部
驱动方法
度量
双向注意力机制
词嵌入向量
矩阵
计算机可执行指令
人脸
图像
卷积神经网络模型
基板管理控制器
转换器
编码器
存储计算机程序
分词
文本
特征提取模块
人工智能技术
语音编码