摘要
本申请公开了一种金属材料的疲劳寿命预测方法、装置、设备及存储介质,涉及材料科学与工程领域,通过构建自定义的强化学习环境,将修正SWT方程转化为决策过程,状态包括当前疲劳寿命估计和疲劳寿命误差,动作为步长因子,然后采用深度确定性策略梯度算法训练智能体,智能体在每次迭代中选择步长因子,并结合牛顿拉夫森迭代法更新当前疲劳寿命估计,奖励函数综合考虑疲劳寿命误差值、疲劳寿命偏差及迭代次数,引导智能体逐步逼近真实解。通过动态调整步长因子,能显著提高求解效率和精度。通过强化学习智能体结合牛顿迭代法,能够根据环境反馈不断优化策略,实现高效的非线性方程求解,同时能够增强模型的收敛性和稳定性,减少对初始值的敏感性。