摘要
本发明涉及一种异构群体协作感知任务分配方案的生成方法和装置。所述方法包括:对任务场景、异构感知主体及协作感知过程进行建模;其中,异构感知主体包括:无人智能终端和人类工作者;对全局系统状态和感知主体的局部观察进行特征提取,得到感知主体的可行动作,并对采用智能体评估网络根据感知主体的局部观察对感知主体的可行动作其进行价值评价,然后通过总体Q网络根据全局系统状态再采用特定的策略进行动作选择,从而对每一个对所有感知主体选择的动作进行评估价值评价,计算损失函数并采用梯度下降法进行智能体评估网络和总体Q网络的参数更新由此进行网络参数更新,得到训练好的神经网络,从而获得异构群体协作感知任务分配方案。