摘要
本发明实施例提供了一种视频生成方法、装置、设备、系统及计算机程序产品。方法包括:获取待处理图像,待处理图像包括图像前景及图像背景,图像背景包括能够生成动态效果的预设图像元素;确定图像前景的前景信息、以及待处理图像的静态提示信息;将静态提示信息和待处理图像输入至多模态大语言模型中进行扩展操作,获得动效提示信息,多模态大语言模型为基于多模态样本进行训练得到;基于待处理图像、前景信息及动效提示信息,生成与待处理图像相对应的目标视频。本实施例中,能够快速、自动地基于图像生成目标视频,降低了视频制作操作的成本和技术门槛,并且由于目标视频是结合动效提示信息所生成,从而保证了视频中动效的流畅度和合理度。