大模型微调方法、电子设备、存储介质及程序产品

申请号：CN202510300651

申请日期：2025-03-13

公开号：CN120218127A

公开日期：2025-06-27

类型：发明专利

摘要

本申请公开大模型微调方法、电子设备、存储介质及程序产品，涉及人工智能技术领域，该方法包括：对通用指令数据集中各个通用样本进行特征编码，以得到相应的各个通用样本嵌入，其中样本嵌入是根据样本所触发的编码神经网络中一组预定义神经元的神经元激活状态而定义的；计算各个通用样本嵌入与目标任务代表性样本嵌入之间的距离；根据所计算的距离从通用指令数据集中筛选至少一个通用样本，以构建针对目标任务的任务微调数据集；根据任务微调数据集，对大模型进行微调训练。由此，所选样本在神经元激活模式上与目标任务样本具有较高的相似性，保障了所选样本对大模型在目标任务下的微调性能提升。

技术关键词

样本微调方法指令数据电子设备人工智能技术计算机程序产品处理器通信存储器编码器定义广义模式