一种用于视频生成的提示词优化方法、系统、设备及介质
申请号:CN202510519510
申请日期:2025-04-24
公开号:CN120449439A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开了一种用于视频生成的提示词优化方法、系统、设备及介质,所述方法具体包括:引导用户在图像编辑界面中绘制包含动态遮罩层及运动轨迹矢量层的运动图;将动词要素与运动轨迹进行空间匹配,结合注意力机制生成矛盾区域热力图;当检测到矛盾区域热力图存在冲突区域时,通过强化学习策略进行意图分析,生成多维度优化方案;对修正后的运动图进行迭代验证,若验证通过,将初始图像和多组运动图输入到多模态大语言模型,生成包含场景适配参数的最终提示词。本发明通过整合图像、语义文本和运动图等多源信息,结合空间匹配、强化学习、物理模型解析等技术,生成包含场景适配参数的精确提示词,显著提升了视频生成的质量和精度。
技术关键词
动态遮罩
连续介质力学
热力图
强化学习策略
运动
大语言模型
轨迹
解耦算法
注意力机制
参数
语义
编码向量
文本
场景
图像
样条插值算法
物理
视频
人机交互接口
意图