摘要
本发明涉及算力调度技术领域,公开了一种基于大模型意图感知的算力资源调度方法、系统,采用BERT架构作为基础模型构建任务意图感知大模型,通过迁移学习适配不同场景的任务特征,输出包含任务类型、优先级、算力需求的特征向量;在边缘节点本地部署轻量化CNN模型,对本地任务数据进行预处理后,上传至任务意图感知大模型进行意图识别;采集边缘节点集群的实时状态参数,结合任务意图感知大模型输出的特征向量与边缘节点的实时状态参数,通过动态调度算法生成算力分配方案;基于算力分配方案执行算力资源调度,并通过反馈机制实时调整调度策略;本发明实现算力需求的预测。