摘要
本发明公开了一种基于视频脚本的动漫视频生成方法及系统,涉及视频合成技术领域,包括,基于结构化脚本数据,结合预定义镜头规则库和强化学习模型,确定镜头类型、时长和运镜效果,并利用动态分镜自动生成机制生成分镜序列,基于分镜序列,通过扩散模型生成动漫风格关键帧图像,通过预定义动作库选择与情感标签匹配的动作数据,通过文本到语音模型生成与情感标签匹配的语音波形,通过音乐库选择与情感标签匹配的背景音乐音频,生成多模态内容流;本发明通过强化学习模型动态优化镜头类型、时长和运镜效果,解决了传统基于静态规则映射的镜头调度方法在时间连续性和叙事连贯性上的不足,明显的提升了分镜序列的叙事流畅度和动态适配性。