摘要
本发明提供了一种数字人视频生成方法、装置、电子设备及存储介质,涉及数字人技术领域。该方法包括:根据文本信息筛选出预设动作模板,得到目标动作模板;获取每帧动作模板图像,并基于各骨骼特征点对应的特征点位置,得到各骨骼特征点对应的位移向量序列;识别目标数字人图像中的各目标骨骼特征点,并基于预设映射关系以及各位移向量序列,确定各目标骨骼特征的目标位移向量序列;将各目标位移向量序列以及目标数字人图像输入到图像生成模型中,生成目标动作图像,并基于目标运动图像生成数字人视频。本发明通过文本信息筛选目标动作模板,并将其映射至目标数字人图像,从而生成目标动作图像,实现文本驱动数字人视频,提高数字人视频的真实性。