摘要
本发明公开了一种基于多目标优化的分布式组件动态资源分配方法,通过在分布式系统中引入PPO算法,针对多个优化目标进行动态调整,以优化资源的整体配置,系统首先收集分布式组件的实时状态、任务需求和资源使用情况,然后利用PPO算法训练智能体,使其能够根据环境反馈逐步优化资源分配策略,PPO算法通过与环境的持续交互,不断调整策略,最终实现对资源调度过程的长期优化。本发明的方法结合强化学习中的PPO算法,实现了在复杂动态环境中对分布式组件的高效资源分配,与现有的规则驱动或静态优化方法不同,能够根据实时变化的任务需求、资源使用情况和系统负载自适应调整分配策略,提升资源利用率,减少系统负担,保证系统在多变条件下的高效运行。