摘要
本发明提出一种用于身份保持的个性化视频生成方法及系统,涉及个性化视频生成的技术领域,该方法包括:获取参考图像与文本提示;利用参考图像与文本提示生成联合潜标记,并将参考图像分割重组得到面部标记序列;采用预设的局部路由器将联合潜标记与面部标记序列融合,生成增强潜标记;对增强潜标记进行去噪,得到初步去噪潜标记;将初步去噪潜标记输入时间自回归模块,得到时间增强潜标记;将时间增强潜标记输入解码器,生成个性化视频。该方法通过引入局部路由器与时间自回归模块,有效提升视频生成过程中的身份保持能力与时空一致性。