摘要
本申请涉及人工智能技术领域,公开了一种生成视频的方法、装置、设备及存储介质。该方法包括:通过大语言模型对目标剧本进行拆分得到分镜脚本,以及从目标剧本中提取各个角色的特征信息。通过生成工具基于特征信息,生成对应的角色形象图;将角色形象图及对应的每个分镜脚本分别输入第三大语言模型,得到每个分镜脚本对应的分镜图;为每个分镜脚本匹配对应的目标音频;将每个分镜脚本与对应的分镜图及目标音频组合,生成对应的分镜视频;将所有分镜视频组合得到目标视频。采用本方法能够根据故事性文字自动化、高效地生成相匹配的具有正确逻辑和情节连贯性的视频,满足用户的个性化需求,并且能够节省大量的人工成本、金钱成本及时间成本。