一种考虑随机时滞的深度强化学习主动控制参数调节方法

申请号：CN202510773613

申请日期：2025-06-10

公开号：CN120491479A

公开日期：2025-08-15

类型：发明专利

摘要

一种考虑随机时滞的深度强化学习主动控制参数调节方法，包括：确定被控结构模型、作动器安装位置，建立结构振动控制动力学方程；确定初步控制器；在作动器中增添随机时滞模拟真实的工作环境，搭建双向通信环境；利用传感器采集的结构响应设置的回馈函数；确定深度强化学习算法、神经网络框架、训练参数，搭建交互界面；在交互界面中对深度强化学习的智能体进行训练，通过深度强化学习算法的累积奖励期望、回馈函数数值进行策略更新迭代以获得成熟智能体；利用成熟智能体作为初步控制器中的参数调节器，实时调整参数数值，实现结构在随机时滞下的振动控制。本发明保证控制器在复杂环境下的鲁棒性，属于结构振动控制领域。

技术关键词

控制参数调节方法深度强化学习算法结构振动控制 LQG控制器结构动态响应神经网络框架 SAC算法状态空间方程策略更新主动控制设备双向通信调节器数值核心算法训练算法界面