一种考虑随机时滞的深度强化学习主动控制参数调节方法
申请号:CN202510773613
申请日期:2025-06-10
公开号:CN120491479A
公开日期:2025-08-15
类型:发明专利
摘要
一种考虑随机时滞的深度强化学习主动控制参数调节方法,包括:确定被控结构模型、作动器安装位置,建立结构振动控制动力学方程;确定初步控制器;在作动器中增添随机时滞模拟真实的工作环境,搭建双向通信环境;利用传感器采集的结构响应设置的回馈函数;确定深度强化学习算法、神经网络框架、训练参数,搭建交互界面;在交互界面中对深度强化学习的智能体进行训练,通过深度强化学习算法的累积奖励期望、回馈函数数值进行策略更新迭代以获得成熟智能体;利用成熟智能体作为初步控制器中的参数调节器,实时调整参数数值,实现结构在随机时滞下的振动控制。本发明保证控制器在复杂环境下的鲁棒性,属于结构振动控制领域。
技术关键词
控制参数调节方法
深度强化学习算法
结构振动控制
LQG控制器
结构动态响应
神经网络框架
SAC算法
状态空间方程
策略更新
主动控制设备
双向通信
调节器
数值
核心算法
训练算法
界面