大语言模型的微调方法、装置、存储介质及计算机设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型的微调方法、装置、存储介质及计算机设备
申请号:CN202510873548
申请日期:2025-06-26
公开号:CN120804698A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种大语言模型的微调方法、装置、存储介质及计算机设备,包括:获取基座大模型,获取目标业务场景下的样本垂类业务数据集和多个业务场景下的样本通用业务数据集;对样本通用业务数据集中的数据进行分类,得到不同分类类别的样本通用业务数据,并分别对每个分类类别的样本通用业务数据进行聚类,得到多个聚类类别下的样本通用业务数据;分别确定每个聚类类别下的样本通用业务数据数据量,并基于数据量,分别在每个聚类类别中确定样本通用业务数据的采样数量;基于采样数量,在对应聚类类别中进行数据采样,并基于采样得到的样本通用业务数据对样本垂类业务数据集进行扩充,利用扩充后的样本垂类业务数据集对基座大模型进行微调。
技术关键词
样本 聚类 数据 大语言模型 微调方法 基座 场景 关键词 计算机设备 微调单元 分词 微调装置 处理器 生成随机 可读存储介质 索引 存储器 节点