大语言模型推理性能评估与优化方法、电子设备和存储介质
申请号:CN202510359521
申请日期:2025-03-25
公开号:CN120297409A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种大语言模型推理性能评估与优化方法、电子设备和存储介质,方法包括:初始化测试环境;动态生成并发用户请求;基述并发用户请求收集性能数据;基于性能数据进行实时监控与报告;基于性能数据生成性能评估报告。通过以上步骤,本发明能够全面评估LLM在高并发场景下的推理性能,确保系统在不同硬件环境中的最优表现。
技术关键词
大语言模型
报告
收集器
数据
时延
动态
电子设备
计算机存储介质
异步方式
处理器通信
服务器
存储器
网络
会话
指令
参数
校正
场景
算法