摘要
本发明提供一种视频摘要生成方法、装置、设备、存储介质和程序产品,涉及视频处理技术领域,该方法包括:通过对目标视频中的多个字幕分别进行语义编码,得到字幕语义编码特征向量的序列;对字幕语义编码特征向量的序列进行上下文编码,得到上下文字幕语义编码特征向量的序列;将上下文字幕语义编码特征向量的序列输入基于序列标注的能量度量注意力模块,得到上下文显著化字幕语义编码特征向量的序列;基于上下文显著化字幕语义编码特征向量的序列,确定目标视频的视频摘要生成文本。本发明可以更深入地理解字幕内容及其在视频中的意义,从而更准确地捕捉视频的核心主题和要点,以此得到更加精确和丰富的视频摘要生成文本。