摘要
本发明提供基于增强学习的大模型参数优化与自适应调整方法,涉及机器学习中基于增强学习对大模型参数进行优化与自适应调整技术领域,包括融合大模型主体、增强学习模块、环境感知模块以及奖励反馈机制的整体架构,用于实现大模型参数的动态优化与自适应调整,在大模型训练初期,能够迅速根据环境反馈增大学习率,使得模型参数快速向最优解方向逼近,大大缩短了训练的前期探索时间。在训练后期,又能精准地减小学习率,避免模型震荡,确保模型稳定收敛到全局最优解。这种动态调整机制有效减少了训练的迭代次数,大幅提升了训练效率,可节省大量的计算资源和时间成本,例如在大规模图像分类模型训练中,可将训练时间缩短30%以上。