一种基于“弹性伸缩”机制的AI算力平台

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于“弹性伸缩”机制的AI算力平台
申请号:CN202510666729
申请日期:2025-05-22
公开号:CN120849090A
公开日期:2025-10-28
类型:发明专利
摘要
本发明涉及人工智能技术领域,公开了一种基于“弹性伸缩”机制的AI算力平台,包括:任务队列模块维护由多个用户端提交的用户任务组成的动态任务列表;历史运行日志数据库收集用户任务多维度资源的历史任务日志数据;任务资源预测模块根据历史运行日志数据预测多维度资源需求;AI算力调度模块根据任务资源预测结果,采用预设的AI算力资源伸缩调度算法,将任务部署到可以满足资源需求的服务器节点中;状态同步反馈模块更新任务执行状态和集群资源状态,并反馈状态变化。本发明解决资源利用率与任务性能的平衡难题,提升大规模集群环境下AI任务调度的智能化与高效性,满足实时性、高并发任务的资源管理需求,为AI应用提供更优的资源调度解决方案。
技术关键词
需求预测模型 服务器节点 队列 模块 资源监控 集群日志 调度算法 XGBoost模型 机制 数据 平台 动态资源调度 资源分配 特征值 机器学习方法 决策树模型 资源特征