一种基于离线强化学习的原型可解释飞行器控制方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于离线强化学习的原型可解释飞行器控制方法
申请号:CN202510635110
申请日期:2025-05-16
公开号:CN120491515A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于离线强化学习的原型可解释飞行器控制方法,包括:获取目标飞行器的当前观测状态,将当前观测状态输入到训练后的飞行器控制模型中,输出当前观测状态对应的动作决策;其中,飞行器控制模型的训练步骤包括:从飞行器在不同环境条件下执行历史任务的离线数据集中,获取多条飞行器轨迹数据;从多条飞行器轨迹数据中,提取训练数据集;利用训练数据集优化飞行器控制模型的参数,获得训练后的飞行器控制模型。该方法通过从大量离线数据中学习,将复杂的参数设置问题转化为数据采样问题,大大简化了参数调整的复杂度;通过离线学习,显著提高样本效率,无需和环境进行交互,显著提高样本效率。
技术关键词
飞行器控制模型 飞行器控制方法 原型 优化飞行器 离线 数据 序列 轨迹 线性 语义特征提取 决策 参数 阶段 时序 样本 复杂度 框架 代表
系统为您推荐了相关专利信息
离线辨识方法 锂离子电池 开路电压法 在线参数辨识方法 等效电路模型参数
异构模型转换方法 校验规则 模型转换系统 数据处理模块 校验模块
事件触发控制方法 并联电路系统 线性化方法 非线性电路结构 矩阵
探测请求帧 信道 时间同步 节点设备 计算机存储介质