一种考虑随机时滞的深度强化学习主动控制参数调节方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种考虑随机时滞的深度强化学习主动控制参数调节方法
申请号:CN202510773613
申请日期:2025-06-10
公开号:CN120491479A
公开日期:2025-08-15
类型:发明专利
摘要
一种考虑随机时滞的深度强化学习主动控制参数调节方法,包括:确定被控结构模型、作动器安装位置,建立结构振动控制动力学方程;确定初步控制器;在作动器中增添随机时滞模拟真实的工作环境,搭建双向通信环境;利用传感器采集的结构响应设置的回馈函数;确定深度强化学习算法、神经网络框架、训练参数,搭建交互界面;在交互界面中对深度强化学习的智能体进行训练,通过深度强化学习算法的累积奖励期望、回馈函数数值进行策略更新迭代以获得成熟智能体;利用成熟智能体作为初步控制器中的参数调节器,实时调整参数数值,实现结构在随机时滞下的振动控制。本发明保证控制器在复杂环境下的鲁棒性,属于结构振动控制领域。
技术关键词
控制参数调节方法 深度强化学习算法 结构振动控制 LQG控制器 结构动态响应 神经网络框架 SAC算法 状态空间方程 策略更新 主动控制设备 双向通信 调节器 数值 核心算法 训练算法 界面