摘要
本发明公开一种基于融合奖励的强化学习稀疏图谱推理方法及系统,通过引入规则集合和融合奖励机制,在应急响应决策中确保准确、及时的反应。同时,构建融合嵌入模块,将大坝应急响应知识图谱中的语义关联信息与图结构信息进行联合表示,为智能体的推理提供更加完整和精准的知识表达,能够应对复杂的应急响应场景。此外,通过基于规则的奖励塑造机制,结合终端奖励实现融合奖励函数,进一步引导强化学习模型生成高质量、可解释的推理路径,确保生成的决策路径在紧急情况下可被快速理解和执行。本方法显著提升了大坝应急响应系统中稀疏知识图谱推理任务的准确性和实用性,能够有效支持知识图谱补全、灾害应急决策和智能预警等领域的应用。