摘要
本发明公开了一种基于多模态大模型的视频转漫画方法,包括:S1,将输入数据输入到任务分配智能体中并传输到视频摘要智能体中,输出关键帧集合;S2,任务分配智能体将关键帧集合和输入数据传输到图片风格迁移智能体中,对关键帧进行字幕移除和风格迁移,输出目标风格图片集合;S3,任务分配智能体对目标风格图片集合中的每个目标风格图片的图片质量进行审核,得到审核后的集合List;S4,布局生成智能体根据集合List进行页面的行布局和列布局并微调,输出符合图片风格要求的漫画书。本发明的视频转漫画方法将视频定制化地转换为漫画书形式,显著减少观看视频的时间成本,提供高度个性化的漫画生成服务,精准满足多样化需求。