摘要
本发明提供了一种面向多智能体系统的自愈式图调度系统及方法。旨在多智能体任务流图中,当任一节点发生失效或升级需求时,能够在低于预设失效阈值的时间内自动完成旁路或热替换,并确保任务拓扑持续无环、数据不丢失、业务不中断。本发明在多智能体任务流程的有向无环图中,为每条边配置主/备节点,通过双通道Gossip心跳实时监测节点健康状态;当主节点满足失效条件时,于毫秒级自动重定向流量至备份节点,并利用XOR‑delta快照恢复节点状态,同时验证拓扑无环性,确保任务连续可追溯。实验结果表明,本发明将平均恢复时间降低至18ms,年停机时间减少十倍以上,适用于智能金融、工业互联网、自动驾驶等需要并行智能体协同且高可用的实时场景。