摘要
本申请公开了一种多模态融合的问答方法、系统及电子设备,涉及数据处理技术领域,包括:首先,获取用户当前时间输入的文本数据、视频数据以及语音数据,并分别获得文本数据对应的第一情感特征、视频数据对应的第二情感特征以及语音数据对应的第三情感特征;然后,采用注意力机制对第一情感特征、第二情感特征以及第三情感特征进行特征融合,并输出融合情感标签;最后,基于融合情感标签以及历史用户画像生成问答结果,并按照多级预设规则逐级依次对问答结果进行验证,当任一级预设规则验证通过时输出问答结果。通过上述方法,能够提高问答结果生成的准确性,并且不会存在不合规的内容,能够更加贴近用户需求,从而提高用户体验感。