摘要
本申请实施例提供一种面向客舱服务的轻量化离线大模型处理方法及装置,涉及计算机技术领域。方法包括:基于在测试集的训练损失,利用量子遗传算法对初始客舱大模型的超参数进行优化搜索,确定最佳超参数组合,并确定最佳超参数组合对应的目标客舱大模型;采用混合精度分层量化策略对目标客舱大模型进行量化处理,得到轻量化客舱大模型;将轻量化客舱大模型以及客舱知识库部署至本地设备,以使本地设备基于轻量化客舱大模型以及客舱知识库处理问答请求。本申请可用于客舱服务场景中,用于解决现有客舱服务专业知识要求高和客舱智能服务中断率高的问题。