智能体的动作执行优化方法、装置、设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
智能体的动作执行优化方法、装置、设备、介质及产品
申请号:CN202510474391
申请日期:2025-04-16
公开号:CN120002667B
公开日期:2025-07-22
类型:发明专利
摘要
本发明实施例提供了一种智能体的动作执行优化方法,可以应用于人工智能技术领域。该智能体的动作执行优化方法包括:获取智能体的当前动作状态对应的奖励评估信息和约束评估信息;对奖励评估信息和约束评估信息执行策略优化处理,以生成当前策略梯度信息,其中策略优化处理的目标是保证动作执行稳定性并最小化能量消耗;通过当前策略梯度信息对预设策略网络执行训练优化,以生成优化策略网络;基于优化策略网络生成目标动作执行信息,目标动作执行信息用于完成智能体的动作执行优化;其中,约束评估信息包括能量约束评估信息和运动对称性约束评估信息。本发明实施例还提供了一种智能体的动作执行优化装置、设备、存储介质和程序产品。
技术关键词
执行优化方法 策略 能量消耗 网络 参数 生成电机 数据 优化装置 处理器 人工智能技术 计算机程序产品 运动 镜像 可读存储介质 指令 模块 电子设备 功率