一种基于深度强化学习的多智能体逃逸方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度强化学习的多智能体逃逸方法
申请号:CN202410776941
申请日期:2024-06-17
公开号:CN118798253A
公开日期:2024-10-18
类型:发明专利
摘要
本发明是一种基于深度强化学习的多智能体逃逸方法,包括以下步骤:获取追方智能体和逃方智能体数量信息、物理尺寸信息、移动信息和追逃环境物理信息;构建追方智能体和逃方智能体各自生成两个演员网络和两个评论家网络分别命名为演员网络、演员网络的目标网络、评论家网络、评论家网络的目标网络;采用MADDPG对追方智能体和逃方智能体各自生成两个演员网络和两个评论家网络进行训练,得到逃方智能体逃脱追方智能体追捕的逃逸算法;追方智能体和逃方智能体的测试集数据,采用逃方智能体逃脱追方智能体追捕的逃逸算法进行测试,得到逃方智能体逃脱追方智能体逃脱任务的完成率,该方法提高多智能体在逃逸任务中的总体性能和效率。
技术关键词
逃逸方法 深度强化学习 Sigmoid函数 物理 算法 浮点数 网络结构 策略 代表 尺寸 标志 数值 矩形 速度 数据
系统为您推荐了相关专利信息
查询方法 数据 查询算法 索引 定义
电能表错接线 诊断方法 功率因数 有功功率 负荷
履带车辆 预测模型训练方法 行驶状态预测方法 状态向量数据 横摆角速度
访问控制系统 分布式访问控制方法 访问控制策略 计算机程序代码 节点
库岸边坡 预测分析方法 贝叶斯网络模型 评价指标体系 解释结构模型