一种基于视频脚本的动漫视频生成方法及系统

申请号：CN202511334901

申请日期：2025-09-18

公开号：CN121000953A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于视频脚本的动漫视频生成方法及系统，涉及视频合成技术领域，包括，基于结构化脚本数据，结合预定义镜头规则库和强化学习模型，确定镜头类型、时长和运镜效果，并利用动态分镜自动生成机制生成分镜序列，基于分镜序列，通过扩散模型生成动漫风格关键帧图像，通过预定义动作库选择与情感标签匹配的动作数据，通过文本到语音模型生成与情感标签匹配的语音波形，通过音乐库选择与情感标签匹配的背景音乐音频，生成多模态内容流；本发明通过强化学习模型动态优化镜头类型、时长和运镜效果，解决了传统基于静态规则映射的镜头调度方法在时间连续性和叙事连贯性上的不足，明显的提升了分镜序列的叙事流畅度和动态适配性。

技术关键词

视频生成方法脚本预定义动作镜头强化学习模型关键帧标签插值模型内容流生成机制视频画面数据风格语音自然语言多模态音频序列文本波形