一种空天地一体化多智能体协同大模型在线训练方法及系统
申请号:CN202510925639
申请日期:2025-07-06
公开号:CN120803722A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种空天地一体化多智能体协同大模型在线训练方法及系统。本发明基于多节点资源异构性动态生成分布式混合精度量化配置表,为不同节点分配适宜的参数精度;采用跨节点梯度残差分发与局部补偿策略,在节点间仅传输压缩后的梯度残差并本地累积误差,定期进行高精度补偿更新;支持将模型参数和学习任务在多节点间弹性划分与动态调度,根据各节点性能和网络状况实时调整任务分配与模型切分;当出现节点失联或计算负载不均时,系统具备容错与自适应调度能力,能够自动重新分配模型片段或调整训练流程。本发明充分利用异构多智能体的算力资源,实现了在带宽受限、节点动态变化的场景下对超大规模模型的高效协同训练。
技术关键词
在线训练方法
空天地一体化
多智能体协同
故障节点恢复
精度
残差信息
故障检测模块
模型更新
容错机制
容错控制
稀疏编码算法
子模块
累积误差
跨节点
任务调度
异构
更新模型参数
分布式环境