基于模块融合的大模型能力扩展方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于模块融合的大模型能力扩展方法及系统
申请号:
CN202510016701
申请日期:
2025-01-06
公开号:
CN120069059A
公开日期:
2025-05-30
类型:
发明专利
摘要
本发明公开一种基于模块融合的大模型能力扩展方法及系统,属于人工智能技术领域。本发明通过引入LoRA模块和融合模块,优化了大规模预训练模型在引入新任务时的能力扩展,保持了较高的微调和推理效率;通过任务数据的抽样重放,有效缓解了不同任务数据质量差异带来的问题,降低了适应新任务的难度。此外,由于本发明设计的模型结构不含有非线性层,因此多个LoRA的合并等效于参数矩阵的乘积运算,该过程可以在不增加大量计算开销的情况下完成能力扩展。
技术关键词
模块
参数
计算机程序指令
数据
计算机程序产品
计算机设备
可读存储介质
预训练模型
扩展系统
人工智能技术
电子设备
处理器
非线性
存储器
矩阵