摘要
本发明涉及一种基于多目标强化学习的城市犯罪事件实时预测方法,包括:对获取到的多个节点数据进行特征提取,得到多个时空特征,其中,每个节点数据包括犯罪发生时间信息、犯罪发生地点信息和犯罪类型信息;将多个时空特征输入门控循环单元中进行处理,得到多个节点隐藏状态数据;将多个节点隐藏状态数据输入预训练好的多目标时空预测解码器中,得到初始预测结果;利用节点嵌入函数对多个节点隐藏状态数据分别进行运算处理,得到多个节点状态数据;基于多个节点状态数据和应用ε‑贪心策略的深度Q网络,确定动作决策变量;对初始预测结果和动作决策变量进行哈达玛乘积计算,得到最终预测结果。该方法可以有效提升犯罪事件预测的实时性和精准度。