基于模块融合的大模型能力扩展方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于模块融合的大模型能力扩展方法及系统
申请号:CN202510016701
申请日期:2025-01-06
公开号:CN120069059A
公开日期:2025-05-30
类型:发明专利
摘要
本发明公开一种基于模块融合的大模型能力扩展方法及系统,属于人工智能技术领域。本发明通过引入LoRA模块和融合模块,优化了大规模预训练模型在引入新任务时的能力扩展,保持了较高的微调和推理效率;通过任务数据的抽样重放,有效缓解了不同任务数据质量差异带来的问题,降低了适应新任务的难度。此外,由于本发明设计的模型结构不含有非线性层,因此多个LoRA的合并等效于参数矩阵的乘积运算,该过程可以在不增加大量计算开销的情况下完成能力扩展。
技术关键词
模块 参数 计算机程序指令 数据 计算机程序产品 计算机设备 可读存储介质 预训练模型 扩展系统 人工智能技术 电子设备 处理器 非线性 存储器 矩阵