MaaS平台大模型推理参数自动优化加速方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
MaaS平台大模型推理参数自动优化加速方法
申请号:CN202511445622
申请日期:2025-10-11
公开号:CN120950083A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供了MaaS平台大模型推理参数自动优化加速方法,包括通过检测硬件配置、构建标准化容器环境并准备压测数据;采用智能搜索算法遍历多维参数空间,通过压测和性能评分公式自动发现特定硬件和模型组合的最优推理参数;将各种硬件型号和模型版本对应的最优参数组合持久化存储到结构化数据库,形成可复用的参数知识库;在模型部署时自动识别当前硬件环境,从参数库中智能匹配并加载对应的最优参数配置,实现零配置优化部署。本发明通过参数组合可行性验证机制,能够及时发现并排除会导致系统错误或内存溢出的参数组合,确保最终选定的参数既能提升性能,又能保证系统的稳定运行。
技术关键词
优化加速方法 参数 设备架构 智能搜索算法 图形处理器卡 系统管理接口 标准化容器 搜索规则 平台 哈希查找算法 调度器 拓扑结构信息 时延 命令 动态剪枝 资源监控 错误日志 脚本 验证机制