一种大语言模型量化质量评估方法及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大语言模型量化质量评估方法及设备
申请号:CN202510313597
申请日期:2025-03-17
公开号:CN120258134A
公开日期:2025-07-04
类型:发明专利
摘要
本申请公开了一种大语言模型量化质量评估方法及设备,方法包括:根据原始大语言模型准确率与量化大语言模型准确率,确定量化大语言模型的准确率系数;根据原始大语言模型文件大小与量化大语言模型文件大小,确定所述量化大语言模型的压缩系数;根据原始大语言模型显存占用大小与量化大语言模型显存占用大小,确定所述量化大语言模型的显存占用系数;根据所述准确率系数、所述压缩系数与所述显存占用系数,对所述量化大语言模型进行评估。确保量化后的大语言模型在性能和存储上的平衡,且也确保模型在不同环境下稳定运行。
技术关键词
大语言模型 自然语言 设备管理 文件夹 评估设备 安装设备 处理器通信 存储器 对象 指令 数据