一种基于多模态大模型的视频转漫画方法

申请号：CN202510870446

申请日期：2025-06-26

公开号：CN120980296A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的视频转漫画方法，包括：S1，将输入数据输入到任务分配智能体中并传输到视频摘要智能体中，输出关键帧集合；S2，任务分配智能体将关键帧集合和输入数据传输到图片风格迁移智能体中，对关键帧进行字幕移除和风格迁移，输出目标风格图片集合；S3，任务分配智能体对目标风格图片集合中的每个目标风格图片的图片质量进行审核，得到审核后的集合List；S4，布局生成智能体根据集合List进行页面的行布局和列布局并微调，输出符合图片风格要求的漫画书。本发明的视频转漫画方法将视频定制化地转换为漫画书形式，显著减少观看视频的时间成本，提供高度个性化的漫画生成服务，精准满足多样化需求。

技术关键词

图片风格关键帧多模态漫画页面生成智能视频帧集合文本摘要布局对象坐标索引字幕数据规划扩展工具