摘要
本发明涉及人工智能技术领域,可应用于智能体自主决策、金融科技及医疗健康等业务场景中,公开了一种动作策略安全增强方法、装置、设备及介质,包括:构建安全约束空间,获取多模态感知数据生成融合安全感知特征,基于任务目标和融合安全感知特征通过策略生成模块生成初始动作策略,将初始动作策略投影至安全约束空间得到安全动作策略,执行过程中监测受控对象状态数据并在状态数据触发监测阈值时执行干预措施,采集执行过程数据并基于执行过程数据更新策略生成模块。本发明通过多模态感知信息与任务目标融合生成初始动作策略,结合安全约束空间投影、状态监测及数据反馈更新策略生成模块,提升机器人在复杂环境中任务执行的安全性。