一种基于离线强化学习的原型可解释飞行器控制方法

申请号：CN202510635110

申请日期：2025-05-16

公开号：CN120491515A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种基于离线强化学习的原型可解释飞行器控制方法，包括：获取目标飞行器的当前观测状态，将当前观测状态输入到训练后的飞行器控制模型中，输出当前观测状态对应的动作决策；其中，飞行器控制模型的训练步骤包括：从飞行器在不同环境条件下执行历史任务的离线数据集中，获取多条飞行器轨迹数据；从多条飞行器轨迹数据中，提取训练数据集；利用训练数据集优化飞行器控制模型的参数，获得训练后的飞行器控制模型。该方法通过从大量离线数据中学习，将复杂的参数设置问题转化为数据采样问题，大大简化了参数调整的复杂度；通过离线学习，显著提高样本效率，无需和环境进行交互，显著提高样本效率。

技术关键词

飞行器控制模型飞行器控制方法原型优化飞行器离线数据序列轨迹线性语义特征提取决策参数阶段时序样本复杂度框架代表

系统为您推荐了相关专利信息

一种实现锂离子电动汽车停止充放电瞬间修正SOC的方法

离线辨识方法锂离子电池开路电压法在线参数辨识方法等效电路模型参数

一种基于源数据的异构模型转换方法、系统、设备及存储介质

异构模型转换方法校验规则模型转换系统数据处理模块校验模块

一种基于Koopman算子的电路系统数据驱动事件触发控制方法

事件触发控制方法并联电路系统线性化方法非线性电路结构矩阵

接入Mesh网络的方法、存储介质及节点设备

探测请求帧信道时间同步节点设备计算机存储介质

一种以板凳龙为原型的带宽度等距螺线运动的规划方法

龙头板凳龙方程原型运动