一种傅里叶描述子奖励函数的强化学习优化微波器件鲁棒性方法
申请号:CN202510335928
申请日期:2025-03-21
公开号:CN120579417A
公开日期:2025-09-02
类型:发明专利
摘要
一种傅里叶描述子奖励函数的强化学习优化微波器件鲁棒性方法。该方法包括以下步骤:首先,将微波器件的结构参数矩阵化;其次,基于深度强化学习框架建立环境,将矩阵化参数添加扰动后作为状态空间输入;接着,设计智能体与环境交互,并结合傅里叶描述子设计奖励函数;然后,通过调整奖励函数比重,无需重新设计即可优化不同微波器件的鲁棒性;最后,利用蒙特卡洛(MC)分析评估器件鲁棒性。实验表明,器件鲁棒性随奖励函数权重变化而调整。该方法具有泛化能力强、适用性广的特点,突破了传统单一器件设计的局限性,能够有效应对制造工艺公差和器件类型差异对性能的影响,为低成本、高性能微波器件的优化设计提供了全新解决方案。
技术关键词
微波器件
鲁棒性方法
深度强化学习
曲线
蒙特卡洛
强化学习环境
神经网络架构
更新网络参数
贪心策略
采取行动
框架
矩阵
特征值
数值
代表
高性能