数字人动画生成及其驱动模型训练方法、装置、电子设备
申请号:CN202410835743
申请日期:2024-06-26
公开号:CN118397155B
公开日期:2024-09-27
类型:发明专利
摘要
本发明公开了一种数字人动画生成及其驱动模型训练方法、装置、电子设备,应用于人工智能技术领域。其中,方法包括获取人脸训练样本数据集;将人脸训练样本数据集的各人物类型面部表情序列进行编码处理,得到任务类型编码特征;将人脸训练样本的音频训练数据输入至语音驱动模型的语音编码模块,得到语音编码特征;将任务类型编码特征、语音编码特征及顶点坐标过程特征,输入至采用预训练好的自然语言模型的数字人网格信息生成模块,将数字人网格信息生成模块输出的数字人网格数据特征输入至顶点序列生成模块,得到数字人网格的顶点坐标数据。本发明可以解决相关技术在面对复杂场景中语音特征较弱的问题,能够精准进行复杂场景下的数字人语音驱动。
技术关键词
模型训练方法
语音编码
网格
顶点
卷积神经网络模块
编码特征
训练样本数据
动画生成方法
人脸
语义注意力
音频
语义特征
自然语言模型
坐标
卷积神经网络模型
多层感知机