一种基于注意力机制的大模型优化方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于注意力机制的大模型优化方法及系统
申请号:CN202510380950
申请日期:2025-03-28
公开号:CN120218251B
公开日期:2025-11-18
类型:发明专利
摘要
本发明属于深度学习技术领域,针对大模型计算资源消耗大、内存占用高及可解释性差等问题,提出一种基于注意力机制的大模型优化方法及系统。方法上,先联合K、V参数矩阵为大KV矩阵,用动态自适应张量分解降维;在各数据处理步骤添加解释层标记处理过程;采用隐式专家协同模型,以门控网络生成权重分解中间计算。其中,张量分解通过NLP模型和拓扑模型预测最优秩并扩展为三阶张量;隐式专家协同模型共享基础参数矩阵、用门控系数组合子网络并实现隐式稀疏性。经实验验证,该方法能缩短计算时间、减少内存占用、提升计算速度、增强模型可解释性与适应性,有效优化大模型性能。
技术关键词
模型优化方法 注意力机制 矩阵 动态门控 秩预测方法 模型优化系统 信息传输通道 图像特征数据 网络 参数 深度学习技术 数据处理模块 标记 元素 自然语言 内存 连线 文本 复杂度