摘要
本公开的实施例提供了确定视频片段的方法、装置、设备、存储介质和程序产品。该方法包括获取目标视频和与目标用户相关联的描述信息,目标视频包括视频帧信息、音频信息和字幕信息,描述信息指示与对目标视频的片段提取相关的要求;从视频帧信息提取视觉特征表示、从音频信息提取音频特征表示、从字幕信息提取第一文本特征表示以及从描述信息提取第二文本特征表示;基于视觉特征表示、音频特征表示、第一文本特征表示和第二文本特征表示,从目标视频确定与描述信息相匹配的至少一个候选视频片段;以及至少基于至少一个候选视频片段各自对应的字幕信息,从至少一个候选视频片段确定与目标用户相关的至少一个目标视频片段。