摘要
本申请实施例提供一种视频问答模型的训练方法、视频问答方法和电子设备,涉及人工智能技术领域,视频问答模型的训练方法包括:获取第一样本数据;第一样本数据包括:第一样本视频帧序列、第一样本问题、第一样本答案和第一样本视频帧序列中的各视频帧的控制令牌;将所述第一样本数据输入待训练的第一模型中进行监督训练,得到第二模型;获取第二样本数据;第二样本数据包括:第二样本视频帧序列、第二样本问题和第二样本答案;根据第二样本数据对第二模型进行微调,得到视频问答模型。本申请使得视频问答模型能够处理和理解连续实时的视频数据流,且能够智能、精确地决定问答响应时机。