摘要
本发明涉及人工智能技术领域,公开了一种基于“弹性伸缩”机制的AI算力平台,包括:任务队列模块维护由多个用户端提交的用户任务组成的动态任务列表;历史运行日志数据库收集用户任务多维度资源的历史任务日志数据;任务资源预测模块根据历史运行日志数据预测多维度资源需求;AI算力调度模块根据任务资源预测结果,采用预设的AI算力资源伸缩调度算法,将任务部署到可以满足资源需求的服务器节点中;状态同步反馈模块更新任务执行状态和集群资源状态,并反馈状态变化。本发明解决资源利用率与任务性能的平衡难题,提升大规模集群环境下AI任务调度的智能化与高效性,满足实时性、高并发任务的资源管理需求,为AI应用提供更优的资源调度解决方案。