目标视频生成方法、装置、电子设备及可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
目标视频生成方法、装置、电子设备及可读存储介质
申请号:CN202411001898
申请日期:2024-07-25
公开号:CN118555423B
公开日期:2024-10-25
类型:发明专利
摘要
本申请涉及人工智能技术领域,提供了一种目标视频生成方法、装置、电子设备及可读存储介质,该方法包括:对第一参考图像和第二参考图像分别进行潜空间特征提取,并进行加权融合处理,得到对应的参考图像的多个第一融合特征图;对第一参考图像和第二参考图像分别进行视觉特征提取并进行加权拼接处理,得到对应的参考图像的多个第二融合特征图;基于各个第一融合特征图、各个第二融合特征图、第一参考图像的视觉特征图和第二参考图像的视觉特征图进行扩散处理,生成目标视频的多个视频帧的特征图;根据目标视频的多个视频帧的特征图,生成目标视频,解决现有技术中视频生成最后一帧图像不可控的问题,提高目标视频的准确性和流畅性。
技术关键词
融合特征 图像 注意力 视频生成模型 视觉特征提取 视频生成方法 空间特征提取 视频生成装置 文本 非线性 电子设备 可读存储介质 人工智能技术 处理器 模块 存储器 编码