摘要
本申请涉及人工智能技术领域,公开了一种视频处理方法、电子设备、可读介质及程序产品。本申请的视频处理方法包括:获取输入视频的第一视频片段;确定第一视频片段中每一帧图像的视觉特征和静态交互特征;根据第一视频片段中每一帧图像的静态交互特征,确定第一视频片段的动态交互特征;基于每一帧图像的视觉特征和第一视频片段的动态交互特征,确定输入视频的预测内容。如此,通过分析第一视频片段中静态交互特征随着时间的推移而发生的变化,可以推断出静态交互特征隐藏的动态交互特征,从而更深入地理解第一视频片段的内容,进而提升视频内容预测的准确性和可靠性。