摘要
本发明公开了一种基于强化学习的分层剪枝时序知识图谱推理方法,其目的是在不完整的时序知识图谱上推理更加准确,缓解动作空间爆炸问题和强化学习中的奖励稀疏问题。目前对基于强化学习的推理问题面临严重的动作空间爆炸问题和奖励稀疏问题,导致推理问题受到阻碍,并且这个问题广泛存在。本发明将基于强化学习的知识图谱推理任务分解为两层,高层实体选择层从关系簇中结合历史信息和时间信息推理出最佳实体,低层关系剪枝层则是进行排除时间剪枝不相关的关系,两层迭代推理,直到推理出目标结果。此外高层中提出了有纠错功能的动作回退机制和实时热奖励函数。该方法可以出色的解决推理过程中动作爆炸和奖励稀疏问题。本发明可以准确的得到在复杂时序知识图谱推理的结果。