大模型微调方法、电子设备、存储介质及程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型微调方法、电子设备、存储介质及程序产品
申请号:CN202510300651
申请日期:2025-03-13
公开号:CN120218127A
公开日期:2025-06-27
类型:发明专利
摘要
本申请公开大模型微调方法、电子设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:对通用指令数据集中各个通用样本进行特征编码,以得到相应的各个通用样本嵌入,其中样本嵌入是根据样本所触发的编码神经网络中一组预定义神经元的神经元激活状态而定义的;计算各个通用样本嵌入与目标任务代表性样本嵌入之间的距离;根据所计算的距离从通用指令数据集中筛选至少一个通用样本,以构建针对目标任务的任务微调数据集;根据任务微调数据集,对大模型进行微调训练。由此,所选样本在神经元激活模式上与目标任务样本具有较高的相似性,保障了所选样本对大模型在目标任务下的微调性能提升。
技术关键词
样本 微调方法 指令 数据 电子设备 人工智能技术 计算机程序产品 处理器通信 存储器 编码器 定义 广义 模式