摘要
本发明具体涉及一种基于强化学习的多模态图谱推理方法,方法包括:获取三元组数据;搭建强化学习模型,强化学习模型包括策略网络模块、动态补全模块和策略优化模块;将三元组数据输入至策略网络模块,构建状态信息和状态信息对应的动作空间,生成状态嵌入,计算状态对应的动作空间的概率分布;将三元组数据和状态信息输入至动作补全模块,构建新的动作空间;将新的动作空间输入至策略网络中,生成新的状态对应的动作空间的概率分布;策略优化模块优化强化学习模型,基于新生成的概率分布,以实现多模态图谱推理。多模态知识图谱通过整合不同源的信息,提供了更全面丰富的知识表示,为智能系统提供了更强大的理解推理能力。