突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法 突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法 关键词: AI,模型训练,Agent,MEM1 AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。 来自主题: AI技术研报 6394 点击 2025-08-21 11:33