摘要
本发明提供一种基于深度强化学习的智能行为建模系统,涉及数据处理技术领域,所述方法包括:从智能体的监测设备中获取智能体的历史状态数据,并将其按照监测时间进行匹配,得到交互数据集,根据交互数据集,得到多维状态向量数据集和标准动作指令数据集,构建智能体的环境空间和行为空间,计算在不同环境空间中智能体执行行为空间中行为的执行结果值,基于深度Q网络构建初始智能行为建模模型,并根据环境空间、行为空间和奖励反馈值,对初始智能行为建模模型进行训练,得到智能行为建模模型,获取智能体的实时状态数据,并将其输入至智能行为建模模型,得到决策行为。本发明能够基于深度强化学习算法对智能体进行行为建模。