摘要
本公开提出了一种大模型训练方法、装置、电子设备、存储介质及产品。所述的方法包括:获取问题文本;对所述问题文本进行编码,得到与所述问题文本对应的第一向量;基于所述第一向量,确定控制网络的第二向量,所述第二向量为所述控制网络的控制条件;基于所述第一向量和所述控制网络的第二向量,确定与所述问题文本对应的输出结果。通过在原有的大模型的基础上,引入控制网络进行联合训练,既保持了原有模型的核心能力,减少训练数据较少的情况下的过拟合风险,又可以对特定任务以特定的控制条件强化模型对该任务的理解能力,解决了大模型在专业领域进行微调困难的问题。