摘要
本发明提供一种基于思维链增强的垂直领域大模型尺度化方法及系统,包括:基于目标垂直领域的行业术语库和输入文本构建动态提示模板,将动态提示模板和输入文本输入深度神经网络模型中进行批处理以生成推理路径数据,对推理路径数据进行质量过滤,输出标准化逻辑链数据集;基于标准化逻辑链数据集和通用数据集实施渐进式混合训练策略,将标准化逻辑链数据集与通用数据集进行动态配比,同时通过基于注意力和梯度裁剪的双重优化机制对垂直领域大模型进行训练;通过混合精度训练与显存动态管理实现垂直领域大模型全参数调整的资源优化,输出优化模型。本发明可实现大模型向轻量化面模型的精准知识迁移与计算强度降维,使模型可以在低资源场景中应用。