一种基于稳定性边缘的大模型优化加速方法及其系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于稳定性边缘的大模型优化加速方法及其系统
申请号:
CN202510585740
申请日期:
2025-05-08
公开号:
CN120579590A
公开日期:
2025-09-02
类型:
发明专利
摘要
本申请公开了一种基于稳定性边缘的大模型优化加速方法,方法包括:输入用于图像分类的神经网络模型的参数与样本集,通过矩阵特征值计算方法计算神经网络海塞矩阵中高特征值及其对应的特征向量;基于高特征值判断是否使用曲率加速,计算并更新曲率加速矩阵;将曲率加速矩阵作用于动量法的指数移动平均,得到神经网络模型的参数更新值,实现图像分类模型的训练过程的加速。本发明方法能够加速图像分类模型的训练过程,并提升大语言模型在预训练过程中对人类语言的处理效率。
技术关键词
优化加速方法
特征值计算方法
神经网络模型
矩阵
图像分类模型
模型更新
优化加速系统
模块
参数
大语言模型
处理器
动态
指数
样本
可读存储介质
存储器
因子
电子设备