一种基于视觉标识符的视频生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视觉标识符的视频生成方法
申请号:CN202511038269
申请日期:2025-07-28
公开号:CN120935377A
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种基于视觉标识符的视频生成方法,属于视频生成技术领域。该方法包括以下步骤:获取输入的视频数据,提取初始的时空特征;初始化可学习的基向量作为视觉标识符,并将其与初始的时空特征各自进行调制;将调制后的视觉标识符和时空特征拼接形成扩展特征序列并对其进行优化,生成视频帧或视频序列后再与视频数据拼接,形成新的视频数据,不断迭代重复,最终输出高质量的视频序列。本发明通过引入视觉标识符,能够在视频生成过程中有效捕捉和利用视频的全局信息,精确调节时空特征,使得生成的视频在空间和时间维度上具有更好的连贯性和一致性。本发明能够提升视频生成质量,优化时空特征的建模,降低视频生成模型的开发成本。
技术关键词
视觉标识符 视频生成方法 序列 多层感知机 注意力机制 数据 参数 计算机电子设备 视频生成技术 视频生成模型 感知损失函数 高维特征向量 存储计算机程序 计算机程序产品 处理器 可读存储介质 存储器 解码器
系统为您推荐了相关专利信息
高压线路故障 无人机巡检路径 巡检路径规划 节点 巡检方法
对象 图像采集装置 定位方法 坐标系 计算机程序产品
大语言模型 时序预测方法 时序预测装置 分词 标记
重识别方法 通道 模块 语义 可见光图像
输出特征 样本 图像检测方法 图像块 检测训练装置