摘要
本申请属于联邦学习领域,具体涉及一种通算一体的多模态联邦学习任务资源调度方法及介质,包括如下步骤:搭建多任务多模态联邦学习环境,完成初始信息探索,使用预设提示词技术调用大模型生成奖励建模函数,由两层强化学习智能体进行每个客户端参与任务与分配带宽资源的决策。由客户端完成本地训练并收集训练过程参数,奖励建模函数根据训练过程参数计算奖励,并指导更新两层强化学习智能体,直至完成收敛既定目标或到达最大通信轮次。本发明所公开的方法能够支持数据分布不均、数据模态缺失、带宽资源有限等多种复杂场景,最小化多任务多模态联邦学习收敛时延。