摘要
一种仿真环境动态更新机器人训练方法。涉及机器人仿真训练技术领域,具体涉及一种仿真环境动态更新机器人训练方法技术领域。本发明根据仿真环境贡献评估方法,以及仿真环境动态更新算法,对仿真环境池进行动态更新,利用动态更新后的仿真环境池对机器人仿真训练。所述方法包括如下步骤:设置仿真引擎集合;初始化仿真环境概率分布;进行环境采样;为了评估初始仿真引擎测试环境的环境贡献特征值,选取环境贡献评估参数:训练环境累计奖励函数平均值、训练环境平均生存时间、训练环境平均运行时间、跨仿真环境累计奖励函数平均值和跨仿真环境平均生存时间;计算环境贡献评分;构建环境分布更新函数;算环境概率分布。