摘要
本发明公开了一种基于强化学习算法的数据驱动群智能管控方法,包括:大数据湖搭建;深度强化学习模型开发优化:采用Deep Q‑Network深度强化学习算法学习复杂的决策策略;多智能体框架搭建:采用Autogen框架实现多智能体之间的沟通,采用Deep Q‑Network强化学习算法作为main智能体可调用的工具规划所有智能体的行动;群智能体协作:main智能体负责发布指令,收集每个智能体的环境反馈,调用深度强化学习算法调整每个智能体的动作。本发明的基于强化学习算法的数据驱动群智能管控方法,将强化学习和群智能策略相结合,使得群里在搜寻策略的过程中能更有效地适应环境变化、避免陷入局部最优解。