视频处理方法及系统、模型的训练方法及系统

申请号：CN202510238452

申请日期：2025-02-28

公开号：CN120163716A

公开日期：2025-06-17

类型：发明专利

摘要

本说明书提供一种视频处理方法及系统、模型的训练方法及系统。视频处理方法包括：基于原始视频生成视频特征，原始视频包括展示有原始对象的多个视频帧。获得原始视频对应的替换要求信息，并基于替换要求信息生成条件特征，替换要求信息表征将原始视频中的原始对象替换为目标对象。将视频特征和条件特征输入至预先训练好的目标模型，以通过目标模型生成目标视频，目标视频是将原始视频中的原始对象替换为目标对象得到的视频。其中，可以通过模型的训练方法，将目标模型训练为采用全3D注意力机制从视频特征中捕捉时空依赖关系，并以时空依赖关系和条件特征作为约束生成目标视频。

技术关键词

视频帧图像嵌入高频特征注意力机制文本训练样本集嵌入特征训练系统姿态识别模型图像识别模型关系对象识别处理器像素点基准参数