摘要
本发明提供了一种数字人生成方法、设备、程序产品及介质,属于人工智能技术领域,所述方法包括:生成目标文本信息对应的音频信息;按照预设图像序列的长度,对所述音频信息进行切分,获得至少两个音频帧序列,所述预设图像序列中的图像帧包含数字人形象;基于所述预设图像序列,并行处理所述至少两个音频帧序列,分别获得每个所述音频帧序列对应的数字人图像序列;对所述音频信息和所述至少两个音频帧序列分别对应的数字人图像序列进行合成处理,获得目标数字人视频。本发明实施例中,能够有效减少基于长文本生成数字人的时间,提高了处理效率,更好地满足了生产需求。